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Introducere 



Aplicaţia SPSS pentru ştiinţele sociale (Statistical Package for the Social Sciences, „pachet 
de programe statistice aplicabile ştiinţelor sociale”) a fost iniţial elaborată în 1965 de 
către Universitatea Stanford din California. A fost primul utilitar pentru analiza datelor 
în acest domeniu, disponibil în universităţi şi în alte locaţii din întreaga lume. Progresele 
moderne în domeniul calculatoarelor au permis ca acest program sâ poată fi folosit şi pe 
calculatoarele personale. Datorită popularităţii sale, folosirea aplicaţiei SPSS este abili¬ 
tatea cea mai uşor transferabilă dintre toate deprinderile necesare în cercetare. Utilizarea 
aplicaţiei SPSS, odată stăpânită, poate fi folosită practic în orice domeniu. în plus, 
aplicaţia SPSS este actualizată în mod constant, astfel încât cele mai recente metode 
statistice sunt incluse în fiecare versiune nouă. 

Această carte nu necesită materiale adiţionale, este un mod de abordare pas cu pas a 
analizei statistice folosind SPSS pentru Windows şi este aplicabilă pentru versiunile 
10,11,12 şi 13. Este destinată studenţilor şi cercetătorilor care doresc să analizeze date 
din psihologie, sociologie, criminologie, sănătate sau date similare. 

Cartea îmbunătăţeşte modul de abordare din A Guide to Computing Statistics with 
SPSS 11 for Windows pentru a asigura un acces rapid către analiza computerizată a datelor 
folosind aplicaţia SPSS. Fiecare tehnică statistică este atent descrisă pas cu pas folosind 
capturi de ecran ale analizei statistice şi ale output-ului din aplicaţia SPSS. Atenţia 
utilizatorului este acum concentrată direct asupra capturilor de ecran, asupra semnificaţiilor 
şi importanţei fiecăreia. Cu alte cuvinte, abordarea folosită în acest manual se apropie 
mult de instruirea prin interacţiune directă, în limitele permise de un material scris. 
Persoanele cu puţină experienţă în utilizarea calculatoarelor sau cele fără experienţă vor 
putea să analizeze în scurt timp date complexe şi să evalueze semnificaţiile output-ului. 

Majoritatea capitolelor au o structură asemănătoare. Paşii urmaţi de calculator (tastele 
care trebuie apăsate) sunt prezentaţi în ordinea exactă. însă acesta nu reprezintă sfârşitul 
analizei datelor, aşadar există şi explicaţii referitoare la modul de interpretare şi prezentare 
a rezultatelor din SPSS. Structura comună este: 

* Trăsăturile importante ale analizelor statistice din respectivul capitol sunt descrise 
într-o prezentare generală. Aceasta va fi suficientă, în majoritatea cazurilor, pentru ca 
utilizatorul să-şi facă o idee clară asupra locului şi momentului în care trebuie folosite 
acele tehnici. 

■ Urmează, apoi, o scurtă introducere referitoare la capitol şi la datele care vor fi 
analizate. 

® Se dau exemple simple de tipuri de date, corespunzătoare fiecărei tehnici statistice. 
Aceste exemple îi permit utilizatorului să parcurgă pas cu pas calculele noastre şi să 
câştige încredere înainte de a trece la propriile date. 
a Se prezintă, mai departe, pe cale vizuală, introducerea datelor pentru o anumită 
analiză statistică, iar explicaţiile sunt expuse în textul alăturat. 














■ Urmează o descriere pas cu pas, imagine cu imagine, a modului în care se realizează 
o anumită analiză statistică folosind aplicaţia SPSS pentru Windows. 

■ Output-ul statistic al SPSS-ului este ilustrat exact aşa cum apare pe monitor şi în 
textul (destinat listării) al analizei. Acest lucru este de importanţă crucială - output-ul 
SPSS-ului poate părea confuz şi neclar la început. 

H Caracteristicile-cheie ale output-ului statistic sunt evidenţiate chiar în capturile de 
ecran, fiind însoţite de explicaţii simple asupra semnificaţiilor părţilor importante ale 
rezultatelor - aplicaţia SPSS fiind bine-cunoscută pentru complexitatea output-ului său. 

* Se dau sugestii pentru prezentarea rezultatelor statistice în rapoarte, teze şi publicaţii. 
Printre acestea se regăsesc şi exemple ale modulului de descriere a constatărilor 
cercetării şi de prezentare clară a tabelelor. 


Această carte este bazată pe ultimele versiuni ale aplicaţiei SPSS pentru Windows (şi 
anume, versiunile 12 şi 13); este însă potrivită şi pentru versiunile 9, 10 şi 11, datorită 
asemănărilor existente. După această introducere urmează câteva observaţii care descriu 
diferenţele majore dintre versiuni. Deşi aplicaţia SPSS este actualizată o dată ia câţiva 
ani, de obicei adaptarea Ia versiunea nouă a cunoştinţelor dobândite cu ajutorul unei 
versiuni anterioare se face cu uşurinţă. 

Introducere în SPSS pentru psihologie (Introduction to SPSS in Psychology) reprezintă 
un unic îndrumar excelent pentru analiza datelor. Este o carte completă, de sine stătătoare, 
conţinând multe caracteristici care nu sunt prezentate în altă parte. Spre deosebire de alte 
cărţi despre SPSS, satisface nevoile studenţilor şi ale cercetătorilor la toate nivelele. 
Totuşi, este şi o parte componentă a unui pachet de cărţi metodologice scrise de aceiaşi 
autori, pachet conceput în ideea de a constitui o sursă exhaustivă şi de încredere. Cele 
trei volume din această serie sunt strâns legate între ele. Celelalte două sunt: 



■ Introduction to Statistics in Psychology (ediţia a III-a, Pearson Education: Harlow, 
2005) - o iniţiere completă în statistică destinată tuturor studenţilor. Este alcătuită 
dintr-o introducere a noţiunilor-cheie ale statisticii în psihologie şi, deşi cartea este 
uşor de utilizat de către studenţi, prezintă în detaliu multe tehnici de nivel mediu şi 
avansat. Conţine capitole care tratează subiecte cum ar fi metaanaliza, care este 
rareori prezentată în alte texte statistice. Important este că structura acestui manual 
statistic este în strânsă legătură cu cartea de faţă. Deci oricine va urmări un capitol 
în manualul amintit va găsi. Ia locul potrivit, unul echivalent în această carte, cu 
detalii referitoare la analiza folosind SPSS. în acelaşi mod, orice persoană care 
utilizează această carte va putea găsi o prezentare în detaliu a tehnicii respective în 
manualul de statistică. 

ffl Introduction to Research Methods in Psychology (Pearson Education : Harlow, 2005) - 
un manual de referinţă despre metodele de cercetare în psihologie. Acoperă atât 
metodele cantitative, cât şi pe cele calitative. Există capitole importante referitoare la 
scrierea rapoartelor, etica în psihologie şi parcurgerea literaturii de specialitate. Sunt 
acoperite toate aspectele elaborării studiilor experimentale, ale cercetărilor de teren, 
ale sondajelor şi chestionarelor şi se oferă îndrumări pentru colecta r ea de date şi 
realizarea unei analize de calitate. Există numeroase referiri reciproce ntre această 
carte şi cea amintită anterior. 
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Cu alte cuvinte, aceste trei cărţi oferă o introducere completă pentru realizarea 
cercetării în psihologie. Pot fi folosite independent sau în orice combinaţie. 

Introducere în SPSS pentru psihologie poate fi utilizat împreună cu orice manual de 
statistică pentru susţinerea unei game variate de cursuri practice şi statistice. Aria 
tehnicilor statistice prezentate este largă, cuprinzând de la cele mai simple până la cele 
mai avansate şi importante tehnici statistice. Varietatea tehnicilor descrise şi relativa 
uşurinţă de folosire a aplicaţiei SPSS pentru Windows fac ca acest ghid să poată fi folosit 
ca metodă de predare a statisticii la nivel introductiv, intermediar şi avansat. Cartea este 
structurată în aşa fel încât procedurile statistice sunt descrise mai mult sau mai puţin în 
ordinea dificultăţii lor conceptuale. în general, modul de lucru cu SPSS este la fel de 
uşor pentru tehnicile statistice avansate, ca şi pentru cele simple. 

Este foarte important să citiţi capitolul 1, pentru că explică introducerea datelor şi 
realizarea operaţiunilor de bază pe computer. Capitolele rămase pot fi uşor folosite ca 
materiale de sine stătătoare. Utilizatorii care nu dispun de suficient timp pentru a 
parcurge în amănunt acest ghid vor putea găsi suficiente detalii în capitolele-cheie pentru 
a putea realiza cu succes o analiză în SPSS. Tabelul 1.1 de Ia sfârşitul capitolului 1 explică 
rolul fiecărui capitol în parte, permiţând astfel cititorului să ajungă direct îa acea parte. 

Cei care vor parcurge cartea cu paşi mici vor profita din plin. Ei vor dispune de o 
privire de ansamblu mult mai bună asupra procedurilor de calcul din SPSS. Pentru 
majoritatea cititorilor, acest lucru este posibil în câteva ore, mai ales dacă au cunoştinţe 
de analiză statistică anterioare. 

SPSS are un catalog extins de proceduri statistice - mult mai multe decât ar putea fi 
incluse într-un manual. Varietatea posibilităţilor poate să-I deruteze cu uşurinţă pe 
cititor, de aceea noi am selectat procedurile potrivite pentru majoritatea scopurilor. 
Uşurinţa şi rapiditatea aplicaţiei SPSS permit utilizatorilor mai avansaţi să exploreze 
posibilităţile existente, folosind meniurile şi ferestrele de dialog. Majoritatea utilizatorilor 
vor găsi prezentarea noastră mai mult decât suficientă. 


v: Informaţiile şi analizele statistice efectuate în această carte corfespund aproape îmotdţ^jnls 
cu -cele din;textul statistic, înrudit, Introduction io Statistics in-Psychology (ediţia a III-a;' 
î Pearson Education: Harlow, 2005)', al aceloraşi autori!' Când vom facereferîrîla această 
1 carte, o. vom denumi ISP, menţionând capitolul-.sau . număruf tabelului corespunzător. 

S* ^ * * Ura 1 


Dorim să mulţumim tehnoredactorilor pentru realizarea capturilor de ecran, a casetelor 
de text şi a săgeţilor care le însoţesc, acestea fiind mult mai bune decât am fi putut noi 
să le facem. 

Dennis Howitt 
Duncan Cramer 








Prifcjpalele diferenţe dintre SPSS 13 
şi versiunile anterioare 


SPSS 12 

în ceea o. priveşte subiectul acestei cărţi, diferenţele esenţiale dintre SPSS 12 şi SPSS 13 
sunt funcţiile „Compute Variable...”, „Scatter/Dot...” şi „Chart Editor”. De asemenea, 
zonele din ferestrele aplicaţiei SPSS 13 sunt acum umbrite. 

în SPSS 12, fereastra de dialog „Compute Variable" are un singur ecran 
„Functions” din care pot fi selectate anumite opţiuni. „Scatter/Dot...” se numeşte 
acum „Scatter”, fereastra de dialog „Scatter/Dot” se numeşte „Scatterplot” şi opţiunea 
„Dot” nu există. 

în SPSS 12, pentru a eticheta regiunile unei diagrame circulare şi pentru a adăuga 
procentajul cazurilor în fiecare dintre ele, daţi dublu clic oriunde în „Chart Editor”, apoi 
dublu clic pe diagrama circulară (pentru a deschide fereastra de dialog „Properties”), 
selectaţi „Data Value Labels” (în fereastra de dialog „Properties”), selectaţi „Count” în 
ecranul „Contents”, selectaţi „X”-ul roşu (pentru a introduce „Count” în ecranul 
„Available”), selectaţi numele variabilei (de exemplu, „Occupation”), selectaţi săgeata 
orientată în sus (pentru a introduce „Occupation” în ecranul „Contents”), selectaţi 
„Percent” şi apoi săgeata orientată în sus (pentru a introduce „Percent” în ecranul 
* „Contents"), selectaţi „Apply” şi apoi „Close”, 

Pentru a introduce o linie de regresie într-un scatterplot, daţi clic în tabelul din 
„Chart Editor”, astfel încât cercurile din desen să fie evidenţiate, selectaţi „Chart”, apoi 
„Add Chart Element”, selectaţi „Fit Line at Total” (care deschide fereastra de dialog 
„Properties”). 

Presupunând că opţiunea „Fit Line” este activă, selectaţi „Linear” (care, de obicei, 
este preselectat) şi apoi apăsaţi „Close”. 


SPSS 11 

Diferenţele esenţiale dintre SPSS 12 şi SPSS 11 sunt valabile ca şi în cazul versiunii SPSS 10. 
Acestea sunt relativ puţine. In cazul versiunilor SPSS 11 şi SPSS 10, denumirile variabi¬ 
lelor nu pot începe cu majusculă şi sunt restricţionate la 8 caractere. 

Opţiunile „Data” şi „Transform” nu sunt disponibile în ferestrele „Viewer” şi 
„Output”. Unele rezultate, cum ar fi corelaţia parţială şi fiabilitatea, nu sunt orga¬ 
nizate în tabele. „Chart Editor” funcţionează diferit. Pentru a introduce o linie de 
regresie într-un scatterplot, daţi dublu^lk.x)xipnde în scatterplot pentru a deschide 








1 \iVi2 


opţiunea „Chart Editor”, selectaţi „Chart”, selectaţi „Options...” (caredeschide fereastra 
de dialog „Scatterplot Options”), selectaţi „Total” din meniul „Fit Line”, iar apoi 
apăsaţi „OK”. 

SPSS 10 

între SPSS 10 şi SPSS 11 sunt diferenţe minore şi abia observabile. 





datelor şi analiza statistică folosind SPSS 


Rezumat 

ffl Acest capitol prezintă noţiuni de bază pentru operarea aplicaţiei SPSS pe un 
computer personal. Descrie atât introducerea datelor, cât şi salvarea fişierelor. 
Vor fi puţine variaţii în accesarea SPSS-ului din locaţii diferite. Noţiunile de bază 
sunt destul de evidente şi uşor de învăţat. 

® Sunt incluse câteva concepte statistice esenţiale pentru a-i ajuta pe cercetători 
să planifice corespunzător analizele statistice. 

1.1. Introducere 

Versiunile SPSS 12 şi SPSS 13 sau cele anterioare, cum ar fi SPSS 10 şi SPSS 11, sunt de 
obicei disponibile pe calculatoarele din universităţi şi colegii. Cei mai mulţi utilizatori vor 
folosi SPSS-ul din aceste locaţii. în lumea întreagă, este de departe cea mai răspândită 
aplicaţie pentru analiza statistică. Prin urmare, învăţarea utilizării SPSS-ului este o abilitate 
transferabilă, adeseori valoroasă pe piaţa muncii. Programul este folosit la toate nivelele, 
începând cu studenţii şi continuând cu cercetătorii specializaţi atât în numeroase domenii 
academice, cât şi în situaţii practice. Un mare avantaj este acela că, odată însuşite noţiunile 
de bază, SPSS-ul poate fi folosit la fel de uşor atât pentru analizele simple, cât şi pentru cele 
complexe. Scopul acestui ghid este acela de a le oferi începătorilor o cale rapidă către 
facilităţile aplicaţiei SPSS. 

In zilele noastre majoritatea oamenilor sunt familiarizaţi cu operarea calculatoarelor 
personale (PC-urile). începătorul absolut nu va fi dezavantajat, deoarece SPSS-ul este 
uşor de învăţat. Utilizatorilor care sunt familiarizaţi, să spunem, cu procesarea de text Ii 
se va părea utilă aceasta în folosirea SPSS-ului ~ de exemplu, deschiderea programelor, 
deschiderea fişierelor şi salvarea fişierelor. Experimentaţi fără teamă. 

Din moment ce SPSS-ul este folosit adesea în cadrul universităţilor şi colegiilor, 
multor utilizatori le va fi necesar un nume de utilizator şi o parolă care'se obţin de Ia 
instituţia respectiva. De multe ori, documentaţia este pusă la dispoziţie în momentul 
înregistrării la colegiu sau universitate. Dacă nu, aceasta este uşor de obţinut. 

Pietograma SPSS-ului ar putea fi găsită printre cele de pe desktop sau în lista de 
programe ale Windows-ului. Fiecare instituţie are propria manieră în ceea ce priveşte 
locaţia unde poate fi găsit SPSS-ul. Această carte are la bază versiunile 12 şi 13 ale 
SPSS. Deşi ele sunt uşor diferite faţă de versiunile precedente 10 şi 11, instrucţiunile se 
aplică aproape în totalitate şi pentru acestea din urmă. 
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1.3. Introducerea datelor 



Coloanele sunt folosite 
pentru a desemna 
diferite variabile. 


Liniile sunt cazurile sau 
indivizii despre care 
deţineţi date. 


Pasul 4 


Pasul 3 


Data Editor al SPSS-ului 
poate fi acum vizualizat 
fără să fie acoperit de 
alte ferestre. Data Editor 
este un spaţiu de lucru 
cu linii şi coloane în care 
pot fi introduse date. 


Pentru a introduce date 
în SPSS selectaţi una 
dintre celule dând un 
clic pe celula respectivă ■ 
întotdeauna în SPSS 
există o singură celulă 
selectată. 


Pasul 5 



Introduceţi un număr 
folosind tastatura 
calculatorului. La 
apăsarea tastei „Enter" 
sau la selectarea cu 
mouse-ul a unei alte 
celule numărul va fi 
introdus în foaia de 
lucru Ia fel cum este 
arătat aici. Valoarea 
6,00 este înregistrarea 
pentru primul rând 
(primul caz) al variabilei 
VAR00001. 



Observaţi că această 
variabilă a primit automat 
un nume standard. Poate 
fi schimbat - daţi clic pe 
numele variabilei şi 
efectuaţi schimbarea. 
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Pasul 6 

Corectarea erorilor - 
folosind mouse-ul, 
selectaţi celula unde 
este eroarea şi 
dactilografiaţi valoarea 
corectată. La apăsarea 
tastei „Enter” sau 
deplasarea pe o altă 
celulă valoarea 
corectată va fi introdusă 


1.6. Salvarea datelor 


iKVAnbbdor 




Selectând „File” şi apoi 
„Save As..." veţi putea 
salva datele sub forma 
unui fişier. Fişierul cu 
datele salvate primeşte 
automat de la SPSS 
extensia „.sav”. Este 
utilă folosirea unor nume 
de fişiere distincte, cum 
ar fi „egl", pentru a face 
conţinutul lor cât mai 
clar. 


l!vv*rv 


1.4. Deplasarea în cadrul unei ferestre folosind mouse-ul 


Pasul 7 


Puteţi muta un rând sau o 
coloană la un moment dat 
apăsând pe butoanele cu 
săgeţi ce se află la capătul 
barelor de derulare situate 
vertical şi orizontal. 

Pentru deplasări ample, 
mişcaţi barele de derulare 
verticale şi orizontale pentru 
deplasarea în cadru! paginii. 

Poziţia relativă a barelor 
de derulare indică poziţia 
relativă în cadrul fişierului. 


Pasul 10 

Pentru a alege locaţia unde 
fişierul de date va fi salvat, 
indicaţi calea în meniul 
„Save in:”. Folosiţi săgeata 
pentru a ajunge la locaţia 
dorită. 
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1.5. Deplasarea în cadrul unei ferestre folosind 
tastatura şi mouse-ul 


1.7. Deschiderea unui fişier de date 


Pasul 8 


Vă puteţi deplasa cu o - 
pagină mai sus sau mai 
jos pe ecran apăsând 
tastele „Pg Up" şi „Pg 
Dn\ 

Săgeţile de la tastatură 
mută cursorul un spaţiu * 
sau un caracter, în funcţie 
de direcţia săgeţii. 


Pentru a deschide un 
fişier existent apăsaţi pe 
„File”, „Open”, „Data", 
„Look in:”, dacă fişierul 
nu este în meniul „Open 
File" (ca în cazul în care’ 
dacă tocmai l-aţi salvat), 
scrieţi numele fişierului ~ 
(„egl”) şi apoi apăsaţi 
„Open”. 


K»*» 









|[j!3egl - SPSS Data Editor 
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Pasul 12 

Pentru a deschide un 
fişier nou apăsaţi pe 
„File”, „New" şi apoi . 
„Data". Acest fişier 
poate fi saivat aşa cum 
a fost arătatJa pasul 9. 


Fila ■ 0ata-%arefoîtf) Anaiyze GrsptiSr^kBMes' Wtndow 


1.8. Folosirea „Variable View” pentru crearea 
şi etichetarea variabilelor 


Pasul 13 

Apăsarea meniului 
„Variable View”, situat în 
Josul paginii, schimbă 
fereastra „Data View" 
(spaţiul de lucru pentru 
introducerea datelor) în 
altă fereastră în care pot 
fi introduse, convenabil, 
informaţii despre 
variabilele pe care le-aţi 
creat. 


Acesta este spaţiul de lucru 
„Variable View". în acest caz, 
o variabilă este deja înregis¬ 
trată. A fost introdusă la 
pasul 5. Poate fi redenumiîă şi 
pot fi adăugate alte variabile 
destul de uşor doar selectând 
celula corespunzătoare şi 
tastând numele variabilei. 

Aici modificaţi lăţimea 
coloanei de date. / 


mu*** 


Aici modificaţi numărul 
de zecimale. 
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Pasul tC 

în versiur.;!e 12 şi 13, faţă 
de cele anterioare, nu 
există limită pentru lungi¬ 
mea numelui unei variabile. 
Versiunile anterioare erau 
limitate la 8 caractere. 
Selectaţi o celulă din 
coloana „Name" şi 
dactilografiaţi un nume de 
variabilă diferit. Restul 
coloanelor vor primi valori 
implicite care poţ fi 
schimbate ulterior. Aceste 
variabile redenumite şi 
nou definite vor apărea în 
„Data View" când această 
fereastră va fi selectată. 



Acesta este numărul de 
zecimale care va apărea 
pe ecran - în calcule este 
folosită valoarea zecimală 
fără aproximări. 


Pasul 16 


Este important de obser¬ 
vat că şi alte coloane pot 
fi modificate uşor, 

Coloana „Labei” permite 
atribuirea variabilelor 
unor nume mai lungi 
decât este posibil în 
coloana „Variable name". 
Pur şi simplu scrieţi un 
nume mai lung în celule. 



Acest lucru nu mai este 


atât de important din 
moment ce versiunea 


SPSS 12 permite 
utilizarea unor nume de 


Capitolul 15 se ocupă 
de valorile lipsă 
(coloana „Missing"). 

Coloana „Values" 
permite definirea unor 
categorii sau valori 
aie unor variabile 
nominale (sau catego¬ 
riale), cum ar fi genul. 
Consultaţi pasul 17 
pentru detaiii. Este 
recomandat să existe 
valori în coloana 
„Values" pentru toate 
variabilele nominale. 


variabile mult mai lungi. 


Pasul 17 

Apare acest buton. 
Daţi clic pe ei. 



Pasul 18 

Va apărea această 
fereastră. Urmăriţi în 
continuare paşii. Vă vor 
arăta cum „male" şi 
„female" sunt introduse 
folosind codul „1" pentru 
bărbat şi „2” pentru 
femeie. 

























Pasul 19 

Scrieţi „1" în dreptul 
câmpului „Value" şi „male” în 
dreptul câmpului „Value 
Labei:”. 


Această operaţie transferă 
informaţia în câmpul aflat 
dedesubt. 






fleirove I 


aitiajs 


Pasul 21 

Acum scrieţi „2" în 
dreptul câmpului „Value’ 
şi „femaie” în dreptul 
câmpului „Value Labei:". 

Apoi apăsaţi „Add". —- 


Această operaţie transferă 
informaţia în căsuţa mai 
mare. 

Este bine să etichetaţi 
valorile în acest fel. 




Apăsaţi „OK” pentru a 
închide fereastra. 
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1.9. Mai multe detalii despre „Data View” 


Pasul 23 


Pentru întoarcere la 
„Data View" apăsaţi 
acest tab din colţul din 
stânga jos al ferestrei. 



Pasul 24 

Aşa arată „Data View" 
acum. 

Pot fi introduse informaţiile 
pentru toate variabilele şi 
cazurile. Nu uitaţi că va¬ 
loarea 5,00 a fost intro¬ 
dusă anterior împreună 
cu numele variabilei. 
Putem începe 
introducerea informaţiilor 
în întregime. 

Pentru a introduce o 
informaţie, selectaţi o 
celulă, introduceţi numă¬ 
rul, şi apoi apăsaţi tasta 
„Enter”. Veţi ajunge în 
celula aflată sub cea 
selectată anterior, care 
va deveni astfel noua 
celulă selectată. 



Pasul 25 

Această captură prez 
felul în care arată o f< 
tipică de calcul cu info 
ţii. Observaţi cum vale 
pentru gen („gender”) 
codate cu 1,00 şi 2,0( 
Este posibil ca în loct 
acestor valori să afişt 
valorile etichetelor. Dc 
clic pe butonul „View" 
bara de sarcini. 




Pasul 26 

Apoi daţi clic pe „Value 
Labels". 
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Pasul 27 


Acum valorile sunt date 
ca „male", „femaie" aşa 
cum au fost codate de la 
paşii 19 până la 21. . 
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Selectaţi „Data” pentru a 
introduce noi variabile, noi 
cazuri, pentru a selecta cazuri şi 
pentru alte manipulări de date. 


Pasul 28 


Selectaţi „Window" 
pentru a comuta între 
foile de calcul cu date şi 
pe cele cu rezultate. 


Sunt multe opţiuni 
disponibile pentru 
dumneavoastră, inclusiv 
analize statistice. 

Câteva dintre aceste 
opţiuni sunt prezentate 
aici. 


Selectaţi „Transform" pentru a Selectaţi „Anaîyze" pentru a Selectaţi „Graphs” pentru 
modifica datele - cum ar fi avea acces la toată gama diagrame cu bare, 
modificarea valorilor şi calculul de calcule statistice pe care scatterplot-uri şi multe alte 
combinat de variabile. le realizează SPSS. metode de reprezentare 

grafică. 


1.10. Un calcul statistic simplu 


Pasul 29 


Pentru a calcula media de 
vârstă urmaţi etapele 
următoare: 




Daţi clic pe „Analyze 1 


Selectaţi „Descriptive 
Statistics”. 


Selectaţi „Descriptive, 
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Pasul 30 



Apare acecsiâ fereastră 
Selectaţi „înteiligence”. 

Daţi clic pe butonul ► 
pentru a muta „Age" în 
căsuţa „Variable(s):". 

Daţi clic pe „OK". .. 


<$>Age 
4> Gendei 


1.11. Output-ul SPSS-ului 


Pasul 31 

Fereastra „Data Editor” 
este înlocuită de 
output-ul SPSS-ului. 
Acest tabel apare pentru 
anaiiza realizată 
anterior. 

Media scorului 
pentru inteligentă 
este încercuită. 


Descriptive Statistic# 


Std. Deviatlon 



Vestea bună este că orice persoană care poate urma paşii de mai sus 
nu ar trebui să aibă nici o dificultate în efectuarea marii majorităţi a 
analizelor statistice disponibile în aplicaţia SPSS, cu ajutorul acestei 
cărţi. Merită să petreceţi în jur de o oră exersând cu SPSS. Veţi 
vedea că aceasta este cea mai rapidă modalitate de a învăţa. 


1.12. Concepte statistice esenţiale 

în analizele cu ajutorul SPSS-ului 

Elementele de statistică sunt destul de simple. Problema apare la asamblarea elementelor. 
Nimeni nu poate deveni peste noapte expert în analiză statistică, dar cu un bagaj mic de 
cunoştinţe, un cercetător neexperimentat poate întreprinde analize sofisticate. Abilităţile 
matematice au un rol mic în analiza statistică a datelor. 

Sunt câteva concepte de bază pe care cercetătorii trebuie să le înţeleagă înainte de a 
trece la analizele SPSS. Acestea includ: 

■ Variabila. O variabilă este orice concept care poate fi măsurat şi care variază. 
Variabilele sunt în general invenţii ale cercetătorilor şi variază enorm de la un studiu 
la altul. Sunt câteva variabile standard, cum ar fi vârsta sau genul, care sunt măsurate 
frecvent. De obicei, variabilele sunt specifice unui segment particular al studiului. 
Variabilele apar în analizele SPSS pe coloane în foile de calcul cu date. 

























■ Cazurile. Un caz este doar un membru a! unei mostre. în psihologie un caz este de 
obicei o persoană (un individ care participă la studiu). Cazurile (în mod normal) apar 
în analizele SPSS ca fiind rândurile unei foi de calcul cu date. 

® Tipurile de variabile. Pentru toate scopurile practice, variabilele pot fi clasificate ca 
fiind de două tipuri: 

- Scoruri. Unele variabile sunt scoruri. Vorbim despre scoruri atunci când o valoare 
numerică este atribuită unei variabile, pentru fiecare caz în parte din eşantion. 
Această valoare numerică indică cantitatea sau valoarea caracteristicii (variabilei) 
în cauză. Astfel, vârsta este o variabilă numerică deoarece valoarea-scor indică o 
cantitate în creştere a variabilei-vârstă. Unii ar putea cataloga acest tip de variabilă 
drept cantitativă. 

- Variabile nominale sau categoriale. Unele variabile sunt măsurate clasificând cazurile 
în unul sau mai multe categorii. Acestea sunt cunoscute drept variabile nominale ori 
categoriale. De exemplu, genul are două categorii denumite bărbat şi femeie. 
Naţionalitatea este un alt exemplu: engleză, galeză, irlandeză şi scoţiană sunt 
naţionalităţile popoarelor din Marea Britanie. Aceste variabile nu au nici o 
implicaţie numerică. A spune că o persoană este de naţionalitate scoţiană este 
echivalent cu punerea ei în respectiva categorie nominală. Unii ar putea privi 
lucrurile calitativ. Există un risc de confuzie - categorii precum genul sunt 
introduse în SPSS folosind numere diferite pentru categorii diferite. De exemplu, 
variabila-gen are două categorii - bărbaţii ar putea fi reprezentaţi prin numărul „1” 
şi femeile prin numărul „2” (sau viceversa). Numerele sunt folosite arbitrar. Este 
foarte important a nu se confunda aceste numere, care reprezintă numai codarea 
diferitelor categorii. Pentru acest motiv este important să etichetaţi explicit valorile 
diferite ale variabilelor nominale în foile de calcul SPSS. Acest lucru poate fi 
făcut cu uşurinţă, aşa cum a fost arătat la paginile 7 şi 8. 

Câteodată variabilele sunt clasificate ca fiind nominale, ordinale, de interval şi de 
raport. Acest lucru este de interes conceptual, însă are o importanţă practică redusă 
în selectarea statisticii corespunzătoare. 

® Este important de hotărât pentru fiecare variabilă în parte dacă este variabilă nominală 
(categorială) sau variabilă cantitativă. Dacă sunteţi începător, scrieţi o listă cu variabilele 
şi clasificaţi-le pe fiecare în parte. în cele din urmă veţi face asta fără prea mare 
bătaie de cap. Tehnicile statistice care corespund variabilelor cantitative nu se 
potrivesc totdeauna pentru cele calitative (şi viceversa). Aşadar, este convenabil de 
calculat media (cantitativă) pentru orice variabilă cantitativă (de exemplu, media de 
vârstă). Pe de altă parte, nu este convenabil să se calculeze media pentru variabile 
care denumesc o categorie. Ar fi un nonsens să spunem că media naţionalităţii este 
1,7 din moment ce naţionalitatea nu este un scor. Problema este că SPSS-ul lucrează 
cu numere în foile de prelucrare a datelor şi nu poate şti dacă este vorba despre 
scoruri sau coduri pentru categorii diferite. 

® Există două tipuri principale de tehnici statistice - statistici descriptive şi inferenţiale: 

- Statisticile descriptive descriu mai ales caracteristicile principale ale variabilelor 
individuale. Deci calculul vârstei medii pentru un eşantion de locuitori este un 
exemplu de statistică descriptivă. Numărarea locuitorilor de naţionalitate engleză 
este un alt exemplu dc statistică descriptivă. Statistici bivariate sunt folosite atunci 
când relaţia dintre două (sau mai multe) variabile este descrisă. 


- Statisticile inferenţiale reprezintă un aspect cu totul diferit al statisticii. Se aplică 
numai pentru a răspunde ia întrebarea dacă ne putem baza pe rezultatele obţinute pe 
un eşantion de cazuri. Folosirea eşantioanelor este caracteristică pentru majoritatea 
studiilor moderne. Problema cu eşantioanele este că unele dintre ele nu sunt 
similare cu populaţia din care au fost extrase. Expresiile „statistic semnificativ” şi 
„statistic nesemnificativ” indică dacă o tendinţă a datelor poate fi acceptată ca 
substanţială (statistic semnificativ) sau insuficient de substanţială pentru a ne baza 
pe ea (statistic nesemnificativ). Obţinerea semnificaţiei statistice este puţin probabil 
să fie rezultatul întâmplării. A se vedea îndrumarul statistic al autorilor, D. Howitt 
şi D. Cramer, Introduction to Statistics (ediţia a III-a, Pearson Educaţional: 
Harlow, 2005), pentru o prezentare în detaliu a înţelesului „semnificaţiei statistice”, 
deoarece este dificil de explicat cu acurateţe doar în câteva cuvinte. 

- Fiecărei statistici descriptive îi corespunde o statistică inferenţială. De exemplu, 
coeficientul de corelaţie este un indicator statistic descriptiv indicând direcţia şi 
intensitatea relaţiei dintre două variabile. Asociat acestui coeficient este statistica 
inferenţială - semnificaţia coeficientului de corelaţie. Statistica descriptivă este 
importantă pentru înţelegerea tendinţei datelor - statistica inferenţială se ocupă de 
încrederea pe care o putem avea în rezultatele obţinute. 

■ Cercetătorii trebuie, de asemenea, să ţină cont de cele două tipuri diferite de modele de 
cercetare - acelea care folosesc măsurători relaţionate sau măsurători nerelaţionate. De 
asemenea, măsurătorile relaţionate pot fi numite măsurători corelate sau măsurători 
pereche. Apoi, măsurătorile nerelaţionate pot fi numite măsurători necorelate sau măsură¬ 
tori independente. Aceşti termeni sunt folosiţi cu precădere atunci când valorile medii 
ale numerelor sunt comparate pentru două sau mai multe eşantioane de date: 

- Când mediile obţinute pentru un singur eşantion de indivizi se compară cu două 
(sau mai multe) măsurători ale aceleiaşi variabile (de exemplu, cele preluate la 
momente diferite de timp), atunci acesta este un model de măsurători relaţionate. 

~ Când mediile pentru două eşantioane diferite de participanţi sunt comparate cu o 
variabilă, acesta este un model nerelaţionat. 

- Când două (sau mai multe) grupe de participanţi au fost potrivite cu atenţie astfel 
încât seturi de participanţi în cele două (sau mai multe) condiţii sum similare în 
unele aspecte, atunci acesta este, de asemenea, un model relaţionat. în acest caz, 
membrii fiecărui set sunt trataţi ca fiind o aceeaşi persoană. în mod normal, un 
cercetător va şti dacă participanţii au fost asociaţi în seturi, deoarece acest lucru 
necesită efort din partea cercetătorului. De exemplu, acestea din urmă trebuie să 
decidă care sunt caracteristicile de asociere a seturilor, iar apoi va alege indivizi 
pe baza similitudinilor caracteristicilor, şi (adeseori) trebuie să distribuie participanţi 
în eşantioane diferite (condiţii) în special în cercetarea experimentală. 

Scopul principal pentru folosirea modelelor relaţionate este reducerea variabilităţii 
cauzate de eşantionare. 

Aproape fără excepţie, cercetătorul va folosi o varietate de tehnici pentru aceleaşi 
date. Din fericire, odată introduse datele, în multe cazuri, analiza acestora durează ceva 
mai mult de un minut. 
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1.13. Ce teste trebuie folosite 

O nevoie frecventă este aceea de a şti cum se alege tehnica statistică corespunzătoare 
pentru date. De-a lungul timpului, autorii de manuale statistice au lucrat în vederea 
simplificării procesului de alegere. S-a lucrat, în mare măsură, la elaborarea de foi de 
lucru care indică* tipul de statistică corespunzător pentru diferite tipuri de date. Dacă veţi 
dori o asemenea abordare, atunci aveţi la dispoziţie aceste site-uri care vă vor ghida de-a 
lungul procesului de alegere: 

http: //www. orthoteers.co.uk/Nrujp~331m/Orthstatstests.htm 
http: //www. wtc.edu/online/bcanada/choose2.htm 
http: //www. members. aol. corn/statware/pubpage. htm 
http: //www. socialresearchmethods. net/selstat/sss tart. htm 
http: //www. graphpad.corn/www/Book/Choose.htm 
http: //www.whichtest.info/ 

http: //www.google.com/search?q=choosing + statisticaî-Hests&hl =en&lr—&ie — 

UTF-8 &safe=off&star t = lO&sa=N 

http : //www.google.com/search?q=choosmg + statistical+tests&hl —en&lr—&ie — 

UTF-8&safe=off&start -20&sa=N 

Pentru statistica de baza este probabil o abordare folositoare. Dificultatea crescând, face 
ca modelele de cercetare, chiar şi pentru proiectele studenţilor, să fie foarte variate şi destul 
de complexe. Cândva, psihologia era aproape numai o ştiinţă bazată pe subiecte de laborator, 
care se concentra pe experimente aleatorii. Psihologii folosesc în continuare astfel de 
experimente, dar metodele s-au extins cu mult, în acest fel extinzându-se şi nevoia de 
cunoştinţe statistice. Astfel, există o limită pentru măsura în care o foaie de lucru simpla 
sau o schemă logică pot ajuta cercetătorii să selecteze analiza statistică corespunzătoare. 

O greşeală fundamentală a cercetătorilor începători este aceea de a presupune că analiza 
datelor este condusă înainte de toate de statistică. Este mai mult decât corect să privim 
statistica drept un instrument care aduce fineţe scopului de bază al cercetării - pentru a 
răspunde la întrebarea cercetătorului cu privire la studiu. Numai cercetătorul poate şti în 
întregime ceea ce vrea să obţină prin studiul său - ce probleme doreşte să fie rezolvate prin 
intermediul colectării datelor şi al analizei lor. Dacă cercetătorul nu înţelege clar ce vrea să 
obţină prin intermediul studiului său, statistica nu-i poate fi de ajutor. Adeseori, când suntem 
consultaţi pentru sfaturi privind statistica, aflăm că întâi de toate trebuie să clarificăm 
obiectivele cercetării - abia apoi să încercăm să desluşim felul în care cercetătorii au gândit 
utilizarea datelor corecte. Acestea nu sunt chestiuni statistice, ci probleme referitoare la 
dezvoltarea ideilor studiului şi planificarea corespunzătoare a achiziţiei de date. Deci 
prima chestiune ţine de evidenţierea întrebărilor pentru care se caută un răspuns, cu datele 
existente. Prea des, atingerea scopului cercetării este pierdută în mulţimea chestiunilor 
practice. Următoarele rânduri vor ajuta la clarificarea rolului statisticii în cercetare: 

* Multe dintre aspectele importante ale analizei datelor nu necesită altceva decât înţelegerea 
valorilor mediilor şi ale frecvenţelor. Acestea sunt des întâlnite printre rezultatele din 
SPSS. Multe dintre întrebările studiului pot primi răspuns pe baza analizei diferenţelor de 
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medii îi¥ls eşantioane, tabele de asociere sau diagrame scatter. Este folositor să ne punem 
singuri întrebarea cum ar putea fi găsite răspunsuri la întrebările studiului doar utilizând 
asemenea abordări de bază. Prea des complexitatea rezultatelor statistice obţinute devine 
centrul atenţiei, ceea ce conduce la confuzie în ceea ce priveşte legătura dintre date şi 
scopurile cercetării. Nu este uşor să ne concentrăm asupra problematicii studiate, fără să 
fim, în acelaşi timp, atraşi în direcţii greşite. 

® Analizele statistice sunt construite dinamic de către cercetător. De obicei nu există o 
singură analiză statistică corectă pentru un set de date, ci o gamă de alternative în 
mod egal acceptate. Cercetătorul va trebui să ia multe decizii de-a lungul procesului 
de analiză a datelor - unele dintre ele vor trebui justificate cu atenţie, iar altele pot 
fi aproape arbitrare. Cercetătorul se ocupă de analiza datelor - statistica este instrumentul 
cercetătorului. Analiza nu trebuie să fie un tur de forţă al statisticii, ci să se lase 
condusă de întrebările care au necesitat colectarea datelor de la bun început. Nu 
există nici o scuză - dacă aţi colectat datele, trebuie să ştiţi de ce aţi făcut acest lucru. 
» Cu cât citiţi în întregime mai multe studii, cu atât mai bine veţi înţelege cum poate fi 
folosită statistica într-un domeniu particular de cercetare. Există foarte puţine studii care 
să nu aibă nici o legătură cu alte studii. Care sunt metodele statistice folosite de cercetători 
pentru domeniul ales? Dacă ştiţi ce tehnici sunt folosite în general, acest lucru vă 
poate fi de mare folos atunci când veţi decide ce anume trebuie luat în consideraţie. 

Tabelul 1.1 oferă o imagine asupra stilurilor de analiză pe care cercetătorii ar putea 
dori să le aplice în cazul propriilor date şi a secţiunilor în care sunt descrise în detaliu 
aceste tehnici statistice. 



Tipul/obiectivul analizei 

Proceduri sugerate 

Capitolul 

Toate tipurile de studii 

Statistici descriptive, tabele şi diagrame 1 

2-6 

Evaluarea relaţiei dintre două variabile 

Coeficientul de corelaţie 

7 


Regresia 

8 

Compararea a două seturi de scopuri 

Testul l pentru eşentioane independente 

13 

pentru depistarea diferenţelor 

Testul raiio F 

19 


Testul t pentru eşantioane perechi 

12 


ANQVA pentru eşentioane 
independente 

20 


ANOVA pentru eşantioane perechi 

21 


Testul Mann-Whitney 

18 


Testul Wilcoxon al rangurilor pereche 

18 

Compararea mediilor a două sau mai 
multe seturi de scopuri 

ANOVA pentru eşantioane 
independente 

20 


ANOVA pentru eşantioane perechi 

21 


Comparaţiile multiple 

23 

































Tipul/obiectivul analizei 

Proceduri sugerate 

Capitolul 

Experimente complexe ctc., având două 
sau mai multe variabile independente şi o 
variabilă dependentă 

- dacă efectuaţi măsurători relaţionate şi 
nerelaţionate 

- dacă există alte variabile care pot afecta 
valorile variabilei dependente 

ANOVA bifactorială sau multifaclorială 

22 

Modelul ANOVA mixt 

24 

Analiza covarianţei 

24 

Eliminarea celei de-a treia variabile care 
poate afecta coeficientul de corelaţie 

Corelaţia parţială 

26 

Identificarea predictoriior pentru o 
variabilă numerică 

Regresia simplă 

8 

Regresia multiplă stepwise 

28 

Regresia multiplă ierarhică 

29 

Analiza logliniară 

31 

Identificarea predictoriior pentru o 
variabilă categorială 

Regresia logistică multinomiată 

32 

Regresia logistică binomială 

33 

Analizarea unui chestionar 

Analiza factorială 

27 

Coeficientul alpha de validitate 

30 

Metoda split-half 

30 

Recodificarea 

16 

Procesarea variabilelor noi 

17 

Compararea datelor de frecvenţă 

Testul chi-square 

14 

Testul Fisher 

14 

Testul McNemar 

14 

Analiza logliniară 

31 

Codificarea datelor deschise cu ajutorul 
evaluatorilor 

Coeficientul Kappa 

30 



2 Descrierea variabilelor 

Tabele şi diagrame 


Rezumat 

ffi Tabelele şi diagramele au menirea de a evidenţia rapid şi eficient trăsăturile 
importante ale datelor. Complexitatea, ca scop în sine, nu este o trăsătură utilă 
a tabelelor şi diagramelor bune. 

* Tabelele şi diagramele clare şi semnificative sunt deosebit de importante pentru 
analiza statistică şi întocmirea rapoartelor. Cu mici excepţii, toate analizele de 
date le utilizează pentru a permite interpretarea distribuţiilor de variabile. în 
acest capitol vom prezenta tehnicile de bază care permit construirea de tabele 
şi diagrame pentru a descrie distribuţia variabilelor prezentate una câte una. 

■ Toate tabelele şi diagramele trebuie să fie denumite şi etichetate clar. în funcţie 
de tabelul sau diagrama în cauză, axele orizontale şi verticale trebuie să fie 
etichetate, barele identificate, scala marcată ş.a.m.d. Acest lucru trebuie făcut 
cu mare grijă. Vorbind la modul general, tabelele şi diagramele din SPSS 
necesită o muncă considerabilă pentru a dobândi eficienţă. 

h Tabelele de frecvenţă numără, ori de câte ori apar, diferite valori ale variabilelor. 
Un exemplu simplu ar fi numărarea bărbaţilor şi a femeilor care participă la 
studiu. Tabelele trebuie să fie relativ simple şi în mod obişnuit necesită fie ca 
variabila să aibă un număr mic de valori, fie ca un număr de valori diferite ale 
variabilei să fie grupate. 

a Diagramele circulare sunt căi eficiente şi simple de a prezenta frecvenţele. 
Totuşi, ele sunt utile doar dacă variabila ilustrată deţine un număr mic de valori 
distincte. Diagramele circulare sunt rareori folosite în publicaţii deoarece consumă 
spaţiu, deşi sunt bune pentru prezentările din cadrul conferinţelor şi pentru prelegeri. 

* O diagramă cu bare (bar chart) poate fi folosită în circumstanţe asemănătoare 
celor pentru diagrama circulară, dar poate face faţă unui număr mai mare de 
valori ale variabilelor fără să devină prea înghesuită. Frecvenţele diferitelor 
valori ale variabilelor sunt reprezentate cu bare separate fizic şi de înălţimi care 
variază în funcţie de frecvenţa acelei categorii. 

a O histogramă este similară unei diagrame cu bare, dar se foloseşte mai degrabă 
pentru scoruri numerice decât pentru categorii. Astfel, barele dintr-o histo¬ 
gramă apar în ordinea mărimii variabilelor numerice pe care Ie reprezintă. într-o 
histogramă, barele nu sunt separate de spaţii'. Adeseori o histogramă va necesita 
ca domeniul variabilelor numerice afişate de fiecare bară în parte să fie modificat 
pentru a maximaliza utilitatea şi claritatea diagramei. Acest lucru poate fi făcut 
recodificând variabilele (capitolul 16), dar SPSS-ul permite ca acest lucru să fie 
făcut în „Chart Editor". Realizarea unor asemenea tabele este una dintre cele 
mai dificile sarcini în SPSS. 
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D~ SCRIEREA VARIABILELOR 


Tabelul 2.1. Ocupaţia participanţilor la studiu exprimată 
în frecvenţă şi în procentaj de frecvenţă 



SPSS este folosit în general pentru a rezuma datele neprelucrate, dar poate utiliza şi 
date care au fost deja rezumate, cum ar fi cele prezentate în tabelul 2.1 (1SP, tabelul 2.1). 

Cu alte cuvinte, din moment ce tabelul 2.1 este bazat pe 80 de persoane, datele vor 
ocupa 80 de celule ale unei singure coloane în fereastra „Data Editor”, şi fiecare ocupaţie 
va fi codată cu un număr diferit, deci „Nuns” ar putea fi codat „1”, „Nursery teachers” 
cu „2” ş.a.m.d. Astfel, sunt necesare 17 rânduri care conţin „1" pentru a reprezenta 
categoria „Nuns”, 3 rânduri care conţin „2” pentru a reprezenta categoria „Nursery 
teachers” ş.a.m.d. Totuşi, este posibil de dus la bun sfârşit anumite analize cu date 
rezumate având în vedere aprecierea convenabilă a categoriilor, după numărul sau 
frecvenţa cazurilor existente. 


2.1. Realizarea tabelelor de frecvenţă prin ponderare 

Pare o practică bună definirea variabilelor în fereastra „Variable View” din „Data 
Editor” înainte de a introduce datele în „Data View”, pentru că putem înlătura câmpurile 
zecimale acolo unde nu sunt necesare. Deci vom face mai întâi acest lucru. Dacă 
preferaţi să introduceţi datele mai întâi puteţi proceda şi în acest fel. 

Pentru acest tabel avem nevoie de două coloane în „Data View”. Una pentru a arăta 
genul categoriilor. Alta pentru a introduce frecvenţele acestor categorii. în „Variable 
View” variabilele sunt prezentate ca rânduri. Din moment ce vom introduce date în 
coloane ne vom referi la aceste rânduri ca fiind coloane. 

Pasul 1 

Selectaţi „Variable View" din 
„Data Editor". 

Denumiţi primele două coloane 
„Occupation” si „Freq". 
înlăturaţi cele două câmpuri 
zecimale. 

Selectaţi partea dreaptă a 
celulei pentru „Values” 
ale „Occupation”. 


£3 occup - SPSS Dat of iMor 
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Pasul 2 

Etichetai;' c» e cinci valori 
pentru „Occupation" aşa 
cum este descris în paşii 
18-20 din capitolul 1. 

Apăsaţi „OK". 



Pasul 3 

Selectaţi „Data View”. 
Introduceţi datele aşa 
cum este arătat. 


^iy»^***’«*^**y 
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i? 

2! 

3 

3 

23 


-20 

5 

17 



Pasul 5 

Selectaţi „Freq", „Weight 
cases by” şi apoi apăsaţi 
butonul ◄ pentru transfer în 
căsuţa variabilei „Frequency 
Variable:”. 


Apăsaţi „OK” 

Cazurile sunt acum 
ponderate în funcţie de 
frecvenţe aşa cum este 
arătat de mesajul „Weight 
On” din colţul dreapta jos al 
ferestrei „Data Editor”. 
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2.2. Frecvenţa procentuală 


Selectaţi „Analyze”, 
.Descriptive Statistics" şi 
„Frequencies...". 
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Pasul 2 

Selectaţi „Occupation” şi apoi 
apăsaţi butonul ◄ pentru transfer în 
căsuţa de variabile „Frequency 
Variable(s):”. 

Apăsaţi „OK”. - 


AOccvpf.'or.; 
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2.3. Interpretarea output-ului 


Ocupaţie 


Prima coloană a acestui 
tabel conţine valorile 
pentru cele cinci 
categorii. Pentru a le 
schimba cu etichete, 
ceea ce este mai 
semnificativ, parcurgeţi 
următorii trei paşi şi 
reluaţi analiza aşa cum 
este descris în tabelul 
alăturat. 



Frequency 

Percent 

Valid Percent 



Percent 

Valid 1 

17 

21.3 

21.3 

21,3 

2 

3 

3.8 

3.8 

25.0 

3 

23 

28.8 

28.8 

53.8 

4 

20 

25.0 

25.0 

78.8 

5 

17 

21.3 

21 3 

100.0 

Total 

80 

100.0 

iOO.G 
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2.4. Etichetarea valorilor 


Pasul 


Selectaţi „Edit şi apoi 
„Options...”. . 


Pasul 2 
Selectaţi „Output 
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Pasul 3 


Apăsaţi „OK", 


Selectaţi butonul de sub 
„Variable values in 
iabels shown as:" şi 
„Labels" din meniul 
drop-down. 


Etichetele sunt acum 
afişate 

A treia coloană afişează 
procentul de frecvenţă 
pentru fiecare categorie, 
incluzând şi valoarea 
lipsă, dar aici nu este 
nici una. 

Deci 17 reprezintă 
21,3% din totalul de 80 
de oameni. 


Occupation 



A patra coloană afişează procentul A cincea coloană adună 
de frecvenţă excluzând valorile procentele în josul tabelului, 

lipsă. Din moment ce nu avem nici astfel 25,0% din cazuri 
o valoare lipsă, procentajul este reprezintă fie categoria 

acelaşi ca în coloana a treia. „Nuns", fie „Nursery 

Teachers". 


2.5. Raportarea rezultatelor 

Numai etichetele categoriale, frecvenţele şi frecvenţele procentuale trebuie să fie pre¬ 
zentate. în consecinţă acest tabel trebuie să fie simplificat dacă va fi prezentat. Dacă 
ocupaţia lipseşte pentru unele cazuri, va trebui să decideţi dacă veţi prezenta procentajele 
incluzându-te sau excluzându-te pe acestea din urmă. Nu este necesar să prezentaţi 
ambele seturi de numere. De asemenea, omiteţi termenul „Valid” din prima coloană, 
deoarece înţelesul său ar putea fi familiar numai pentru utilizatorii de SPSS. 
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2.6. Dărâmă circulară pentru date categoriale 


Selectaţi „Occupation” şi 
apoi apăsaţi butonul < 
de lângă „Define Slices 
by:” pentru a introduce 
variabila „Occupation 


Apăsaţi „OK . 


Pasul 1 

Selectaţi „Graphs" şi „Pie". 


Pasul 2 

Selectaţi „Define". 


Pasul 3 
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“t-z 


Acesta este felul în care apare 
o diagramă circulară folosind 
opţiunile predefinite din 
SPSS. Sectoarele de cerc 
sunt codate cu diferite culori. 
Culorile nu au fost reproduse 
aici. 

Caracteristicele din această 
diagramă pot fi modificate cu 
„Chart Editor". Vă vom arăta 
cum să etichetaţi fiecare 
sector pentru ca cititorul să 
nu fie nevoit să folosească 
codul culorilor, şi cum să 
schimbaţi culorile cu modele 
monocrome. 



Occupation 
a Nuns 

0 Nursery Teachers 
o Television Presenters 
a Students 
□ Other 


Cazurile comparate după frecvenţă 


2.7. Adăugarea etichetelor unei diagrame 

circulare şi înlăturarea legendei şi a etichetei 


Pasul 1 



Daţi dublu clic oriunde în 
dreptunghiul care conţine 
diagrama, pentru a 
selecta „Chart Editor", 

Selectaţi „Elements" şi 
„Show Data Labele”. 






Pasul 2 

Selectaţi „Count” şi „X"-ul 
roşu pentru a nu afişa. 

Selectaţi „Occupation” şi 
săgeata verde curbată în sus, 
pentru a afişa denumirile 
ocupaţiilor. 

Procedaţi asemănător pentru 
„Percent” pentru a afişa 
procentajul fiecărei ocupaţii în 
parte. 

Selectaţi „Apply” şi „Close” 
dacă nu doriţi să faceţi vreo 
schimbare ulterioară a 
proprietăţilor diagramei 
circulare. 
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Pasul 3 



Pentru a mări caracterele la 
dimensiunea 14, selectaţi 
butonul ▼ de lângă „Size” şi 
„14” din meniul care se va 
deschide mai jos. 


Dacă nu doriţi să faceţi vreo 
schimbare ulterioară a 
proprietăţilor diagramei 
circulare, selectaţi „Apply” şi 
„Close” (butonul „Cartce!" se 
schimbă în „Close”). 


Selectaţi „Text” dacă vreţi să 
schimbaţi formatul textului, cum 
ar fi caracterele îngroşate 
(Bold) şi dimensiunea acestora 
(Font Size). 


Pentru a folosi caracterele 


îngroşate selectaţi butonul ▼ 
de lângă „Style” şi apoi 
din meniui „dropdown". 


Pasul 4 


Pentru a înlătura legenda, 
selectaţi „Qptions” şi 
„Hide Legend". 


Pentru a înlătura „Cases 
weighted by Freq", daţi 
clic o dată pe etichetă, 
încă un clic, şi apoi 
stergeţi-I. 



Occupation 

B>ur» 

□ T P>******* 
■ Suferit 

O CC<* 


Nursery Teachers 
3.75% 


Students 

25.0% 


C«m« iwijMed by rnq 
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Aceasta este diagrama 
circulară cu sectoarele 
denumite şi frecvenţa 
procentuală afişată. 



Nuns 

21.25% 


Nursery Teachers 


Students 


Television Presenters 
28.75% 


DESCRIEREA VARIABILELOR 


Aceasta es:a o 
diagramă circulară cu 
sectoare ce au modele 
alb-negru. 



2.8. Schimbarea culorii unei diagrame 
circulare cu un model alb-negru 


2.9. Diagramă cu bare pentru date categoriale 


Pasul 1 

In „Chart Editor", daţi 
clic pe sectorul de cerc 
pe care vreţi să-l 
schimbaţi, şi apoi încă un 
clic acolo unde marginea 
este o linie dublă. 






Pasul 2 

Selectaţi „Edit" şi 
„Properties". 

Selectaţi .Fiii” şi culoarea 
albă. 

Pentru a adăuga o margine 
neagră, selectaţi „Border" 
şi culoarea neagră. 

Pentru a adăuga un model, 
selectaţi butonul ▼ de 
lângă „Pattern" şi modelul 
pe care îl doriţi. 

Selectaţi „Apply" şi apoi 
„Close". 

Folosiţi aceeaşi procedură 
pentru celelalte patru 
sectoare. 






Pasul 2 

Selectaţi „Define”; 
„Simple" este 
preselectat. 




||f|fC*ricd 


"Help vi; 

JIU ,S tacked _ ^ . 4§g| 

M| 1 ff ffj t 

—■ 

r^SwJfftatttw.^,separe vwables •< 
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IIM»» 


Neither .igreenor disaj 
Dîsagrcs • 

Strcmgly disagree 


30.0% - 

Aceasta este o 25.0% - 

diagramă cu bare. Poate 
fi editată cu „Chart Editor" 20.0% • 
dacă doriţi. c 

S 15.0% - 
« 

“■ 10 . 0 %- 


5.0% 4 


Occupation 


Cases weighted by Freq 


Pasul 3 


Selectaţi ocupaţia şi apăsaţi 
butonul ► de lângă , “ ' 
Axis” pentru a introd 
ocupaţia acolo. 


Selectaţi „% of cases 


Apăsaţi „OK". 


0 . 0 % 


Nuns 


Nursery 
Teachers Presenters 


2.10. Histograme 

Vom ilustra procesul de realizare a unei histograme folosind datele din tabelul 2.2 care 
indică distribuţia atitudinilor studenţilor faţă de statistică. Noi am etichetat această 
variabilă „Response”. 

Tabelul 2.2. Distribuim răspunsurilor studenţilor la afirmaţia 
„Statistica este materia mea preferată la universitate" 


Pasul 1 

în „Data Editor" introduceţi 
datele. clasificaţi-Ie şi 
etichetaţi-le aşa cum s-a 
arătat la începutul acestui 
capitol. 


li 

' Resp6‘nsa;| 


M 

__a 


17 



~3 

6 

— 

m 

4 

2 


m 

■/* 

5 

1 

— 


Pasul 2 

Selectaţi „Graphs" şi 
„Histogram...". 
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Pasul 3 



Selectaţi „Response" şi 
apăsaţi butonul < de 
lângă „Variable" pentru 
duce variabila 
„Response" în acea 
căsuţă. 

Apăsaţi „OK". 



I 

£■: 



Aceasta este 

histograma, care poate 20 

fi editată cu „Chart 

Editor". 15 


Pentru a înlătura statisticile, 
daţi clic pe ele şi ştergeţi-le. 

Pentru a schimba 
denumirile axelor daţi clic 
pe ele şi editaţi-le. __ 


Pentru a înlătura „Cases 2 3 4 5 

weighed by Freq", daţi clic . Response 

pe etichetă, selectaţi-o şi ~~ ~~ *- c a ses weighted by Freq 

ştergeţi-o. 


Mean * 1,9 
Std. Dev. a 
N = 40 


1.008 


3 Descrierea numerică a variabilelor 

SVîedie, variaţie şi dispersie 


Rezumat 

■ în acest capitol vom descrie modul de lucru al unui număr de statistici, care 
rezumă şi descriu caracteristicile esenţiale pentru fiecare variabilă importantă. 
Tehnicile prezentate în acest capitol implică variabile individuale luate separat. 
Cu alte cuvinte, sunt tehnici statistice cu o singură variabilă sau univariate. 

« flecar© dintre ele genereizâ un indice numeric pentru a deierte Caracteristicile 
datelor. 

■ Cu excepţia modului ce poate fi folosit pentru orice tip de date, celelalte tehnici 
sunt destinate datelor care au forma unor scoruri numerice. 

* Indicatorul medie reprezintă media aritmetică a unui set de scoruri. Se obţine 
prin însumarea valorilor şi prin împărţirea rezultatului la numărul de valori. 

■ Modul este pur şi simplu valoarea cu cea mai mare frecvenţă. Un set de valori 
pot dispune de mai mult de un mod, în cazul în care două sau mai multe valori 
apar cu frecvenţe egale. Modul este valoarea variabilei care apare cel mai 
frecvent - nu este frecvenţa cu care apare cel mai frecvent scor. 

■ Mediana este valoarea din centrul distribuţiei, dacă variabilele numerice sunt 
ordonate după mărime, de la cea mai mică la cea mai mare. Din diverse motive, 
câteodată, mediana este o estimare a scorului mediu - de exemplu, când 
numărul scorurilor este egal, nu există o medie bine determinată. 

■ Procedurile descrise în acest capitol pot fi modificate rapid pentru a produce 
valorile varianţei, boltirii şi ale altor statistici descriptive. 


Vom ilustra calculul medici, al medianei şi al modului folosind vârstele studenţilor de 
la universitate. 


Tabelul 3.1. Vârstele pentru 12 studenţi 











3.1. Introducerea datelor 


Pasui 1 


în „Variable View" din 
„Data Editor” denumiţi 
prima coloană „Age". 

îndepărtaţi cele două 



zecimale. 


Pasul 2 

în „Data View" din 
Editor" introduceţi 
vârstele în prima 
coloană. 



3.2. Efectuarea analizei 


Pasul 3 

Selectaţi „Analyze", 
„Descriptive Statistica” 
şi „Frequencies... s . 
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Pasui 4 



Selectaţi „Age" şi butonul ► 
pentru a-l introduce în lista 
de variabile. 

Deselectaţi „Display 
frequency tables". Ignoraţi 
mesajul de avertizare. 

Apoi daţi clic pe 
„Statistics...”. 


Displsji ttequency tablei 



Pasul 5 

Selectaţi „Mean”, „Median", 
şi „Mode". 

Daţi clic pe „Continue". 

Apăsaţi „OK” din ecranul 
anterior, care reapare. 


3.3. Interpretarea output-ului 

■x 



Există 12 cazuri cu date valide pe care se bazează analiza. 
Nu sunt date lipsă (0). 

Media de vârstă media aritmetică = 20,5 ani. 

Mediana de vârstă (vârsta persoanei aflate la mijlocul 
listei de vârste de la cea mai mică la cea mai mare) este 
de 19,00 ani. 

Valoarea mod de vârstă (cea mai comună) este 19. 


Consultaţi următorul tabel de rezultate. Acesta 


furnizează frecvenţele pentru fiecare valoare. O variabilă 


poate avea mai mult de un mod. 


aa 
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3.4. Raportarea output-ului 

® Media, mediana şi modul pot fi prezentate sub formă tabelară ca în tabelul 3.2. 

® Pentru majoritatea datelor două zecimale sunt mai mult decât suficiente. Majoritatea 
măsurătorilor sunt aproximative şi utilizarea mai multor zecimale tinde să dea o falsă 
senzaţie de precizie. 

® Pentru mediană, este probabil mai clar dacă valoarea raportată este 19 în loc de 
19,00. Totuşi, dacă valorile de după virgulă sunt diferite de ,00, acest lucru ar trebui 
inclus în raport pentru că arată faptul că estimarea medianei nu corespunde nici 
unui scor. 


Tabelul 3.2. Media, mediana şi modul pentru vârstă 



3.5. Alte caracteristici 


Veţi vedea din căsuţele de dialog de la pasul 5 că sunt multe alte valori statistice 
adiţionale care pot fi calculate. Nu ar trebui să aveţi mari dificultăţi pentru a le obţine, 
adaptând paşii prezentaţi anterior. 

Centilele. Acestea indică punctele de separaţie pentru procentajele scorurilor. Aşadar 
al 90-lea cenţii este valoarea numerică care separă cele 90% de valori de dedesubt, din 
punct de vedere al mărimii. 

Cvartilele. Valorile distribuţiei care indică punctele de separare pentru cele mai mici 
25%, cele mai mici 50% şi cele mai mici 75% dintre scoruri. 

Suma. Tbtalul scorurilor pentru o variabilă. 

Skewness. Distribuţiile de frecvenţă nu sunt întotdeauna simetrice faţă de medie. 
Asimetria este un indice de asimetrie sau „înclinare” a distribuţiei scorurilor pentru o 
variabilă. Valoarea este pozitivă dacă valorile sunt asimetrice spre stânga, sau negativă 
dacă valorile sunt asimetrice către dreapta. 

Kurtosis. Acesta este un index pentru cât de ascuţită sau turtită este distribuţia 
scorurilor pentru o variabilă, comparativ cu distribuţia normală. Va fi cu semnul „+" 
pentru curbe de frecvenţă ascuţite şi cu semnul pentru curbe turtite. 

Abaterea standard (estimată). Este o evaluare a măsurii în care scorurile diferă în 
medie faţă de media scorurilor pentru o variabilă particulară. în SPSS abaterea standard 
este calculată ca o evaluare a abaterii standard a populaţiei. Este un indice pentru 
variabilitatea scorurilor în jurul valorii medii a variabilei. Unii autori numesc acest 
indicator abatere standard. 


DESCRIERE,- NUMERICĂ A VARIABILELOR 53 

Vanu-xa (estimată). Aceasta este o evaluare a măsurii în. care scorurilor variază îs 
medie fi o ,.e media scorurilor pentru variabila respectivă. Este pătratul abaterii standard 
şi evident în strânsă legătură cu ea. Este de asemenea o estimare a varianţei populaţiei 
în SPSS. Unii autori numesc acest indicator varianţă. Ca şi abaterea standard, aceasta 
este un indice pentru variabilitatea scorurilor în jurul valorii medii a unei variabile, dar 
are, de asemenea, şi alte utilizări în statistică. în special, este unitatea standard de 
măsurare în statistică. 

Rang. Diferenţa numerică între cel mai mare şi cel mai mic scor obţinut pentru o 
variabilă. Este un singur număr. 

Minim (scor). Valoarea celui mai mic scor al datelor pentru o variabilă particulară. 

Maxim (scor). Valoarea celui mai mare scor al datelor pentru o variabilă particulară. 

Eroarea standard (ES medie). Valoarea medie cu care mediile eşantioanelor extrase 
dintr-o populaţie, diferă faţă de media populaţiei. Eroarea standard poate fi utilizată 
asemănător cu abaterea standard şi varianţa, ca un indice pentru variabilitatea scorurilor 
în jurul valorii medii a unei variabile. 
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^J" Forme ale distribuţiilor scorurilor 

.. - . .__J_ 


■ Este important de studiat forma distribuţiilor scorurilor pentru o variabilă. în mod 
ideal pentru majoritatea tehnicilor statistice, o distribuţie ar trebui să fie simetrică 
şi cu formă normală (formă de clopot). 

■ Unele tehnici statistice sunt foarte eficiente când distribuţiile variabilelor implicate 
sunt normal distribuite. Abaterile majore faţă de normalitate trebuie evitate, dar, 
pentru eşantioane de dimensiuni relativ mici, verificarea vizuală a diagramelor 
de frecvenţă este singurul mod practic de a le evita. Efectele eşecului de a 
îndeplini acest criteriu pot fi supraevaluate. Câteodată este posibilă transfor¬ 
marea statistică a unor scoruri pentru a aproxima o distribuţie normală, dar este 
în mare măsură o chestiune de încercare şi eroare, folosind, de exemplu, scale 
logaritmice. 

■ Totuşi, cercetătorii trebuie să fie precauţi faţă cu distribuţiile foarte asimetrice şi 
cele care conţin câteva scoruri neobişnuit de mici sau de mari (atipice). 
Histogramele, de exemplu, pot fi folosite pentru detectarea asimetriei şi a 
valorilor atipice. 

b Cercetătorii trebuie să ia în calcul combinarea rangurilor scorurilor (în opoziţie 
cu tabelarea fiecărei valori individuale posibile) pentru a clarifica distribuţia 
datelor. Eşantioanele de dimensiuni mici, tipice multor lucrări în psihologie şi 
alte ştiinţe sociale, pot conduce la figuri sau diagrame risipite, în care tendinţele 
nu sunt clare. 

Noi vom elabora un tabel de frecvenţă şi o histogramă cu scorurile obţinute la 

evaluarea extroversiunii pentru 50 de piloţi de linie aeriană, arătate în tabelul 4.1. 

Tabelul 4.1. Rezultatele obţinute la evaluarea extroversiunii 
pentru 50 de piloţi de linie aeriană 




4.1. Introducerea datelor 


Pasul 1 


în „Variable View” din 
„Data Editor” denumiţi 
prima coloană „Extrav”. 

înlăturaţi ceie două 
zecimale. 

Salvaţi aceste date ca 
un fişier pentru utilizare 
în capitolul 9, 



Pasul 2 

în „Data View" din „Data 
Editor" introduceţi 
scorurile la evaluarea 
extroversiune în prima 
coloană. 




_ 

Extrav | 


-V 

-*- 3 


5 

5 


3 

5 


§ 

4 


«1 

1 al 


4.2. Tabele de frecventă 


Pasul 3 

Selectaţi „Analyze", 
„Descriptive Statistics’ 
şi „Frequencies...". 
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Pasul 4 



Selectaţi „Extrav” şi apoi 
apăsaţi butonul < pentru a-! 
introduce în lista de variabiie. 


Apăsaţi „OK”. 








4.3. Interpretarea output-ului 

Prima coioană arată cele 
cinci valori ale extroversiunii 
care sunt de la 1 la 5. 


A doua coloană arată 
frecvenţa acestor valori. 
Sunt 7 cazuri în care 
valoarea este 1. 

A treia coioană exprimă aceşti 
frecvenţe ca un procent al 
numărului total incluzând şi 
datele care lipsesc. Din 
totalul cazurilor, 14% au 
valoarea 1. 


Extrav 



Frequency 

Percent 

Valid Percent 

Cumulative 

Percent 

kYalid 1 

_7 

^ 14.0 

/ 14 -° 

14.0 


10 

22.0 

20.0 

/ 22.0 
7 20.0 

36.0 

.56.0 

4 

9 

18.0/1 

' 18.0 

/74.0 

5 

13 

zm 

26.0 

/ 100,0 

Total 

50 

AW.Q 

100.0 
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A patra coloană exprimă aceste 
frecvenţe ca un procent al 
numărului total excluzând datele 
lipsă. Din moment ce nu sunt 
cazuri lipsă, procentajele sunt 
identice cu cele din coloana a 
treia. 


A cincea coloană 
cumulează aceste 
procentaje în josul 
tabelului. Aşadar, 
56% din cazuri au 
valoarea 3 sau valori 
mai mici. 


4.4. Raportarea output-ului 


Observaţi că în tabelul 4.2 am omis unele dintre detaliile neclare ale rezultatelor. 
Tabelele şi diagramele ar trebui să clarifice rezultatele. 


Tabelul 4.2. Un mod de a raporta rezultatele din SPSS 
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4.5. Histograme 


Pasu 1 


Selectaţi „Graphs’ 
„Histogram...”. 


Selectaţi „Extrav" şi apoi apăsaţi 
butonul ◄ pentru a o introduce _ 
în caseta de variabile. 

Apăsaţi „OK". —-- 


Pasul 2 
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4.6. Interpretarea output-ului 



Axa orizontală arată ceie 
cinci valori diferite ale 
„Extrav" de la 1 la 5. 


Axa verticală arată 
frecvenţa cazurilor de la 
0 la 14 din doi în doi. 

Înălţimea barelor arată 
cât de frecvent apare 
fiecare scor la 
extroversiune. 


Mean = 3.2 
Std. Dev. => 1.414 
N = 50 


Media scorului la extroversiune este 3,2, 


Abaterea standard este 1,414. 
Numărul cazurilor este 50. 


4.7. Raportarea histogramelor 


Ar trebui să editaţi 
histograma înainte de a 
o raporta. 

Schimbaţi „Frequency" 
în „Frequencies" şi 
.Extrav" în „Extraversion 
scores”. Aceste 
proceduri sunt descrise 
în capitolul 2. 



Extraversion scor. 



5 Abaterea standard 

Unitatea de măsură standard în statistică 


Rezumat 

a La bază, abaterea standard este un indice pentru cât de mult deviază (diferă) 
unele scoruri „în medie” faţă de media setului de scoruri din care acestea fac 
parte. Cu alte cuvinte, abaterea standard este un indice pentru variabilitatea 
scorurilor în jurul mediei acestora. 

® Abaterea standard poate fi de asemenea folosită pentru a transforma scoruri 
pentru variabile foarte diferite în scoruri z(sau „standard"), care sunt uşor de 
comparat şi însumat, din moment ce sunt plasate pe aceeaşi scală de măsurare. 
Această scală standard are întotdeauna o medie de zero şi o abatere standard 
de 1,0 indiferent de variabilele în cauză. 

® Scoruriiele standard apar într-o varietate de feluri în statistică, deşi nu totdeauna 
într-o formă evidentă. De exemplu, coeficientul beta din regresiile multiple se 
bazează pe notele standard. Scorurile zsunt uşor de procesat în SPSS, dar o 
înţelegere conceptuală a acestora este utilă în numeroase contexte. 

s Abaterea standard, în sine, are întotdeauna o valoare pozitivă, dar cercetătorii 
menţionează un număr de abateri standard peste medie („+" relativ la medie) 
sau pentru un număr de abateri standard sub medie relativ ia medie). 
Aşadar, scorurile peste media eşantionului vor fi întotdeauna convertite la scoruri z 
(sau standard) cu un prefix pozitiv. Valorile sub medie vor fi întotdeauna convertite 
la scoruri zeu un prefix negativ. 


Calcularea abatere standard şi a scorurilor z este ilustrată cu nouă valori ale vârstei 
din tabelul 5.1. 


Tabelul 5.1. Date pentru calcului abaterii standard 


Agc 20 25 : 19 ; 35 V 19 17 '• 15 










60 


INTRODUCERE ÎN SPSS PENTRU PSIHOLOGIE 




5.1. Introducerea datelor 


Pasul 1 


în „Variable View" din 
„Data Editor" denumiţi 
prima coloană „Age". 

înlăturaţi cele două 
zecimale. 





5.2. Abaterea standard 



Pasul 3 

Selectaţi „Anaiyze", 
„Descriptive Statistics" 
şi „Descriptives...*. 



ABATEREA STANDARD 
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Pasul 4 



Selectaţi ^ge n şi apoi apăsaţi 
butonul -4 pentru a o introduce 
în lista de variabile, „Variable(s): 

Selectaţi „Options...".„ 


Pasul 5 

Deselectaţi 
„Mean", 
„Minimum* şi 
„Maximum". 

Selectaţi 

„Continue". 

Selectaţi „OK" 
din ecranul 
precedent, 
care reapare. 



5.3. Interpretarea output-ului 

Descriptive Statistics 

Numărul de cazuri este 9. 

Abaterea standard pentru 
„Age" este 6,652. 
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5.4. Scorurile z 



Pasul 1 


La pasul 4 selectaţi 
„Save standardized 
values as variables' 

Apăsaţi „OK". 


Pasul 2 

Scorurile z'sau 
standard sunt în a 
doua coloană din 
„Data View" în „Data 
Editor" şi sunt 
numite „ZAge”. 


5.5. Raportarea output-ului 


Abaterea standard pentru o variabilă este uşor de menţionat în textul raportului: „A fost 
determinată abaterea standard a vârstei ca fiind 6,65 ani (N - 9)”. 

însă este mai probabil că veţi vrea să înregistraţi abaterea standard împreună cu alte 
statistici, cum ar fi media, rangul, cum este ilustrat în tabelul 5.2. Veţi dori probabil să 
includeţi aceste statistici pentru alte variabile numerice pentru care aveţi date. 


Tabelul 5.2. Dimensiunea eşantionului, media, rangul şi abaterea standard 
pentru vârstă, 1Q şi fluenţă verbală 


ABAi EREA LAisU-vKu 


Co 


5.6. Alte caracteristici 


Meniul „Descriptives...” conţine un număr de calcule statistice care pot fi selectate : 

Mean 

Sum 

Standard deviation (estimate) 

Range 

Minimum 

Maximum 

Kurtosis 

Skewness 


Aceste concepte statistice sunt explicate pe scurt la sfârşitul capitolului 3. 







|Relaţiile dintre două sau mai multe variabile 

Diagrame şi tabele 


Rezumat 

■ O mare parte a cercetării studiază relaţiile dintre două sau mai multe variabile. 
Procedurile statistice univariate (o singură variabilă) descrise până acum pot fi 
utilizate pentru analiza, practic, a oricăror date. Totuşi, multe dintre întrebările 
cercetării necesită, de asemenea, ; ca relaţiile şi corelaţiile dintre diferite variabile 
să fie studiate. 

■ La fel ca pentru statistica univariată, o analiză statistică bivariată completă a datelor 
necesită studierea tendinţelor fundamentale ale datelor utilizând tabele şi diagrame. 
Metodele de prezentare a relaţiilor bivariate includ crearea tabelelor de asociere, 
histograme compuse (diagrame cu bare grupate) şi diagrame scatter. Multe 
dintre acestea sunt deja familiare, dar totuşi pot genera dificultăţi. 

* Trebuie să fiţi siguri că tabelele şi diagramele obţinute sunt folositoare şi clare, 
în particular, asiguraţi-vă că datele pentru tabelele de asociere şi histogramele 
compuse (diagrame cu bare grupate) conţin numai un număr mic de valori 
diferite ale datelor. Dacă nu, SPPS-ul va produce tabele masive, grafice şi 
diagrame dense şi ilizibile. 

■ Etichetarea tabelelor şi a diagramelor în întregime este o condiţie de bază, 
împreună cu un titlu clar. 

■ Pe de altă parte, diagramele scatter funcţionează bine şi când aveţi multe valori 
diferite ale variabilelor. 

■ Tipul tabelului sau al diagramei care este cel mai eficient pentru comunicarea 
relaţiilor dintre date depinde foarte mult de tipurile datelor implicate. Două 
variabile numerice, în general, vor fi cei mai eficient prezentate sub forma unei 
diagrame scatter, în timp ce două variabile nominale sunt în general prezentate 
sub forma unui tabel de asociere. 

■ Amintiţi-vă că pentru prezentarea eficientă a statisticii descriptive fundamentale 
cercetătorii trebuie să planifice cu grijă tabelele şi diagramele. Adeseori cercetătorii 
vor trebui să „altereze” lucrurile pentru a transforma tabelele şi graficele finale 
în forme eficiente de comunicare. Faptul că acest lucru poate fi efectuat rapid 
este unul dintre avantajele utilizării SPSS-ului. Este recomandat să fie evitată 
tentaţia de a copia pur şi simplu tabelele şi diagramele SPSS-ului în raport. Nu 
este aproape nici o prezentare a rezultatelor în SPSS care să nu poată fi 
îmbunătăţită şi clarificată. Opţiunile da bază din SPSS nu sunt întotdeauna 
ideale pentru acest aspect. Adeseori, procedurile de editare disponibile pentru 
tabelele din SPSS pot îmbunătăţi enorm lucrurile. 

■ Realizarea de tabele, ca acelea discutate în acest capitol, este una dintre 
sarcinile dificile în SPSS. 
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Vom iînstra elaborarea unui tabel de asociere şi a unei diagrame cu bare compusă, cu 
datele din tabelul 6.1 (ISP , tabelul 6.4). Acesta prezintă numărul de bărbaţi şi femei 
dintr-un studiu care au fost sau nu spitalizaţi anterior. Dacă datele au fost deja introduse 
în SPSS, atunci paşii de la 1 la 5 pot fi ignoraţi. 


Tabelul 6.1. Tabel de asociere între variabilele gen şi spitalizare 


■■■'.■■■■.vi'""-... 
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Introduceţi aceste numere în 
„Data View” din „Data Editor" 

Primul rând se referă la 
bărbaţii care au fost spitalizaţi 
care sunt în număr de 20. 

Al doilea rând se referă la 
femeile care au fost spi- *- 
talizate; care sunt în număr 
de 25. 

Al treilea rând se referă la 
bărbaţii nespitalizaţi; care 
sunt în număr de 30. 

Al patrulea rând se referă la 
femeile nespîtaiizate; care 
sunt în număr de 14. 


6.2. Ponderarea datelor 


Pasul 4 


Pentru a pondera datele 
cu scopul ca cele patru 
celule să conţină 
numărul de cazuri 
corespunzător, selectaţi 
„Data" şi „Weight 
Cases...". 


1 

1 


'1 

2 


2 

1 


2 

2 
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Pasul 7 


Pentru a pune 

„Hospltalisatlon" pe rândurile 
tabelului, seiectaţi-o şi apoi 
apăsaţi butonul ► de lângă 
eticheta „Down:\ 


Pentru a pune „Gender pe 
coloanele tabelului, selectaţi-o 
şl apoi apăsaţi butonul ■« de 
lângă eticheta „Across:". 


Apăsaţi „OK . 


.Tabels" şi „Basic 


Pasul 5 


Selectaţi „Freq", „Weight 
cases by* şi apoi apăsaţi 
butonul « pentru transfer 
în căsuţa variabilei 
.Frequency Variable:'. 


Apăsaţi „OK". 


Cazurile sunt acum 
ponderate în funcţie do 
frecvenţe, aşa cum este 
arătat de mesajul „Weight 
On’ din colţul din dreapta jos 
al ferestrei „Data Editor". 


6.3. Crearea tabelelor de asociere 


Pasul 6 



























Pasul 10 

Selectaţi „Output 
Labels". 


Pasul 9 

Selectaţi „Edit" 
şi „Options...". 
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Pasul 8 


Tabelul din output este 
structurat ca tabelul 6.1, 
cu excepţia câ cele două 
valori pentru fiecare 
variabilă nu sunt 
etichetate. Dacă este 
necesar etichetaţi 
aceste valori folosind 
paşii 9. 10 şi 11 şi 
reluaţi analiza. 


Hospilalisation 
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Selectaţi bJtonul ▼ de sub 
eticheta „Variable values in v 
labels shown as:" şi „Labels" 
din meniul drop-down. 


Apăsaţi „OK". 


6.4. Afişarea frecvenţelor ca procentaj din numărul total 


Pasul 12 


Acesta este tabelul cu 
valorile etichetate. 
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Pasul 11 


La pasul 7 selectaţi 
„Statistics...". 

Selectaţi „Tables%". 

Apoi selectaţi „Add”. 

Apăsaţi „Continue". 

Apăsaţi „OK”. 


oenoer 


Females 


Maies 


Hospitaiisation Hospitaltsed 

Not hospitaiised 
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.u 


Dacă veţi aduna pro¬ 
centajele din cele patru 
celule, suma lor este 100. 



6.5. Afişarea frecvenţelor ca procentaj din suma coloanei 



Selectaţi „Col%" şi „Add' 
Apăsaţi „Continue". 


Row '< 


jlajwf % 


Apăsaţi „OK" din ecranul 
anterior, care va 
reapărea. 


iTatota* 

ije*n 


•WdtkK 


Dacă adunaţi 
procentajele de pe 
fiecare coloană, ele vor 
însuma 100. 




Wtfiflht Că.*** 
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6.6. Diagrama procentuală 

compusă cu bare (suprapuse) 


Pentru a obţine o 
diagramă procentuală 
cu bare compuse 
(suprapuse) în care 
barele să reprezinte 
100%, va trebui să 
Introduceţi cifrele de 
procentaj (coloană 
numită „ColPerCent") 
pentru cele două bare şi 
să le ponderaţi. 


|^>Gend«lG»ă&fL j 
•$F,eq(Freq) ^ 


Pasul 2 

Selectaţi „Graphs' 
şi „Bar...*. 


Pasul 3 
Selectaţi „Stacked' 
Selectaţi „Define". 


u_.iL. 

251 

*1 
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Pasul 4 
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Selectaţi „Hospitalisation 
şi apoi butonul ► de lângă 
eticheta „Category Axis: 


Selectaţi „Gender” şi 
apoi butonul ◄ de lângă 
eticheta „Define Stacks by 


Apăsaţi „OK . 


Pasul 5 


„Count" se referă la „Percent, 
dar poate fi schimbat \ 
cu „Chart Editor" (vezi ' 
capitolul 2). 


I Gender 
H Males 
E3 Females 


Hospitalised Not hospitalised 

Hospitalisation 
Cases weighted by ColPerCent 



WejgfitCasM' 


BarCHarts 


wjm 




ŞimM 


Selectaţi „Ctustered", 
şi apoi „Define". 
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6.7. Hteijgramă compusă (diagrame cu bare grupate) 


Pasul 1 


Ponderaţi cazurile după „Freq" .. 
în loc de „ColPerCent", 
selectând „Data", „Weight 
Cases...", „Freq”, „Weight cases 
By" şi apăsănd butonul < pentru 
a introduce frecvenţa tn căsuţa 
variabilei „Frequency Variable:". 

Apăsaţi „OK". 


Pasul 2 

Selectaţi „Graphs”,. 
apoi „Bar...". 


Pasul 3 










! :ţ> froq [Fraql 

CoPoCent 


Gender 
■ Males 
0 Fe males 


Pasul 4 

Selectaţi „Hospltalisation” şi apoi 
apăsaţi butonul ► de lângâ. 
eticheta „Category Axis:”. 

Selectaţi .Gender” şi apoi butonul ► 
de lângă eticheta „Define Stacks 
by:". ^ 

Selectaţi „% of cases". 

Apăsaţi „OK". 


Hospitalised Not hospitalised 

"cspîtalisation 

Casss wsighted by Freq 


u\ rfcW'i'RU i'MHULOGih 


Pasul 5 


Aceasta este diagrama 
cu bare realizată. 


70.0% 

60.0% 

50.0% 

40.0% 

30.0% 

20 . 0 % 

10 . 0 % 

0 . 0 % 


Coeficienţi de corelaţie 

» > 

Coeficienţii de corela ţie Pearson şi Spearman 


Rezumat 

■ Există mai mulţi coeficienţi de corelaţie. In general, cel mai comun şi cel mai 
folositor este de departe coeficientul de corelaţie Pearson. Corelaţia biserial phi 
şi coeficientul de corelaţie Spearman sunt doar variante ale sale. 

w Este o practică utilă să desenaţi o diagramă scatter pentru că aceasta prezintă 
datele incluse într-un coeficient de corelaţie. Veţi avea nu numai o reprezentare 
vizuală a relaţiei, ci şi un ajutor pentru identificarea unor serii de probleme cum 
ar fi relaţiile curbe şi prezenţa valorilor atipice. Coeficientul de corelaţie Pearson 
presupune o relaţie în linie dreaptă între două variabile. Este înşelător dacă 
între două variabile există o relaţie curbă. Valorile atipice sunt scorurile extreme 
şi neobişnuite care distorsionează mărimea coeficientului de corelaţie. Printre 
remedii este inclusă examinarea relaţiei omiţând valorile atipice. în mod alternativ, 
un coeficient de corelaţie Spearman este mai puţin afectat de valorile atipice, 
deci se poate examina şî mărimea coeficientului Spearman pentru aceleaşi 
date. 

* Un coeficient de corelaţie este o măsură numerică sau un indice al gradului de 
asociere între două seturi de scoruri. Intervalul de valori este de la maxim +1,00, 
prin 0,00, până la-1,00. 

* Semnul „+” indică o corelaţie pozitivă - anume că scorurile unei variabile se 
măresc odată cu creşterea scorurilor celeilalte variabile. Semnul indică o 

. corelaţie negativă - anume că, în timp ce scorurile unei variabile cresc, scorurile 
pentru cealaltă variabilă descresc. 

a O corelaţie de 1,00 indică o asociere perfectă între cele două variabile. Cu alte 
cuvinte, o diagramă scatter a celor două variabile va arăta că toate punctele 
sunt conţinute de o singură dreaptă. O valoare de 0,00 indică faptul că toate 
punctele din diagrama scatter sunt dispersate aleatoriu în jurul oricărei drepte 
desenate pe această diagramă a datelor sau sunt aranjate într-o manieră 
curbilinie. O corelaţie de -0,5 ar indica o relaţie moderat negativă” între cele 
două variabile. 

a Coeficientul Spearman este coeficientul de corelaţie Pearson aplicat unor 
scopuri după ce acestea au fost ordonate crescător pentru cele două variabile 
în parte. Este foiosit atunci când premisele coeficientului de corelaţie Pearson 
nu sunt îndeplinite de către date - această situaţie se petrece în specia! în 
momentul în care scorurile pentru o variabilă au o asimetrie pronunţată. 
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« Din moment ce coeficienţii de corei: î sunt de obicei bazaţi pe eşantioane de 
date, este obişnuită incluziunea explicaţiei privind importanţa statistică a coefi¬ 
cientului de corelaţie. Importanţa statistică este o declaraţie a probabilităţii de 
a obţine un coeficient de corelaţie particular pentru un eşantion de date dacă 
nu există nici o corelaţie (corelaţie de 0,00) în cazul populaţiei din care a fost 
extras eşantionul. SPSS-ul poate oferi semnificaţii statistice sub forma unei 
valori exacte sau a unuia dintre nivele de semnificaţie convenţionale critice (de 
exemplu, 0,05 şi 0,01). 

Vom ilustra calculul corelaţiei Pearson, o diagramă scaiter şi coeficientul de corelaţie 
Spearman pentru datele din tabelul 7.1, care prezintă scoruri ale abilităţilor muzicale şi 
matematice pentru 10 copii. 


Tabelul 7.1. Scopurile abilităţilor muzicale 
şi matematice pentru 10 copii 



7.1. Introducerea datelor 



Pasul 1 


în „Variable View" din 
„Data Editor” denumiţi 
primul rând „Music” şi al 
doilea „Math". 

înlăturaţi cele două 
zecimale schimbând 
cifra prezentă aici în 
zero. 
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Pasul 2 


în „Data V;s\r/’ din „Data 
Editor" introduceţi datele 
pentru muzică în prima 
coloană şi cele pentru 
matematică în cea de-a 
doua coloană. 


Salvaţi datele ca un 
fişier pentru utilizare în 
capitolul 8. 


7.2. Corelaţia Pearson 


Pasul 2 


Selectaţi „Music” şi „Math" 
împreună sau separat şi 
apăsaţi butonul -i pentru a ie 
introduce în lista de variabile 
aşa cum este arătat aici. 


Apăsaţi „OK”. 


Pasul 1 

Selectaţi „An 2 
„Correiate" şi 
„Bivariate...". 
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7,3. Interpretarea output-ului 

Corelaţia dintre „Math" şi 
„Music" este -0,900. La un 
test de semnificaţie, 
two-taiied ia nivelul de 
probabilitate de 0,001 sau 
mai mic, corelaţia este 
statistic semnificativă. 

Numărul cazurilor pe care 
este bazată corelaţia este 
10. Informaţia apare şi în 
această celulă. ~ 


7.4, Raportarea output-ului 

* Corelaţia dintre abilităţile muzicale şi cele matematice este -0,900. Se obişnuieşte să 
se rotunjească corelaţia cu două zecimale, deci aceasta va deveni -0,90. Acesta este 
un rezultat mai mult decât precis pentru majoritatea măsurătorilor psihologice. 

* Nivelul de semnificaţie exact, cu trei zecimale, este 0,000. înseamnă că nivelul de 
semnificaţie este mai mic decât 0,001. Vă sugerăm să nu folosiţi un şir de zerouri, 
pentru că derutează cititorii. întotdeauna schimbaţi ultimul zero In 1. Aceasta 
înseamnă că nivelul de semnificaţie poate fi raportat ca fiind p < 0,001. 

■ Se obişnuieşte să fie prezentate gradele de libertate (DF) în locul numărului de 
cazuri, când se prezintă corelaţiile. Gradele de libertate sunt egale cu numărul de 
cazuri minus 2, adică 8 pentru această corelaţie. Nu este nimic greşit în a raporta 
numărul de cazuri în schimb. 

* într-un raport, noi am serie; „Există o relaţie negativă semnificativă între abilităţile 
muzicale şi cele matematice (r « -0,90, DF - 8, p < 0,001). Copiii cu nivel ridicat 
al abilităţi muzicale au un nivel scăzut al abilităţii matematice”. Semnificaţia coefi¬ 
cientului de corelaţie este discutată în detaliu în acest manual (capitolul 10). 
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7.5. Coeficientul de corelaţie Spearman 


Pasul 1 



Identic corelaţiei Pearson, 
selectaţi „Analyze”, 
„Correlate", „Bivariate" şi 
variabilele pe care vreţi să 
ie corelaţi. 

Selectaţi „Spearman".^^ 

Dacă nu doriţi Pearson, 
deselectaţi-l. 


<$> Maths 


7.6. Interpretarea output-ului 


Coeficientul de corelaţie Spearman 
intre „Math" şi „Music” este -0,894.. 

Nivelul de semnificaţie, luând în 
calcul două ipoteze, este 0,001 - 

sau mai mic, deci corelaţia este 
statistic semnificativă. 

Numărul cazurilor este 10. 
Informaţia este oferită şi în 
această celulă. 


Spearman's rho Music Correlation Coefficient ~ 

-—— Oiy. flHai lc ii) - 

N 

.—-—Moli IS Cui ifTation Coefficient 

Sig. (2-talled) 

**. Correinlion is significant at the 0.01 level (2-taited). 


Music 

Malhs 




.000 

10 

n- 10 

-.894** 

.000 

1.000 

->-10 

10 


7,7, Raportarea output-ului 

6 Corelaţia raportată cu două zecimale este -0,89. 

a* Probabilitatea de a obţine această corelaţie din întâmplare este mai mică de 0,001 

(p < 0 , 001 ). 

® Noi am raporta astfel: „Există o corelaţie negativă semnificativă între abilităţile 
muzicale şi cele matematice (Coeficientul Spearman = -0,89, DF — 8, p < 0,001). 
Cei cu nivel mai ridicat al abilităţii muzicale au abilităţi matematice scăzute şi 


viceversa'. 
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7,8. Diagrama scatter 


Pasul 1 


Selectaţi „Grap 
„Scatter/Dot..." 


Pasul 2 


Selectaţi „Deţine" din 
moment ce „Simple" 
este deja selectat. Se 
numeşte opţiunea 
predefinită. 
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Pasul 3. 


Pentru a avea variabila „Music" 
ca axă verticală, selectaţi-o şi 
apoi apăsaţi butonul ► de lângă 
căsuţa „Y Axis”, 

Pentru a avea variabila „Math" 
ca axă orizontală, selectaţi-o şi 
apoi apăsaţi butonul < de lângă 
căsuţa „X Axis". 

Apăsaţi „OK". 


11111 





watm 


mm 




7.9. Interpretarea outpui- 


în diagrama scatter, răspân¬ 
direa punctelor este relativ 
îngustă, ceea ce indică o 
corelaţie mare. 

Forma împrăştierii rezultatelor 
este relativ în linie dreaptă, 
indicând mai degrabă o relaţie 
în linie dreaptă decât o relaţie 
curbilinie. 

Linia este de la colţul stânga 
sus până în dreapta jos, ceea 
ce indică o corelaţie negativă. 

Dacă relaţia este curbilinie, 
atunci corelaţiile Pearson şi 
Spearman pot fi înşelătoare. 




3 4 
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7.10. Raportarea output-ului 

® Nu ar trebui să raportaţi niciodată un coeficient de corelaţie fără a examina diagrama 
scatter, din cauza unor probleme cum ar fi relaţiile curbilinii sau valorile atipice ( ISP, 
capitolul 7). 

® Intr-un proiect studenţesc ar trebui să fie întotdeauna posibilă includerea de grafice 
de acest fel. Din păcate, articolele de jurnal sau cărţile tind să aibă restricţii referitoare 
la numărul de grafice inclus, din cauza spaţiului pe care îl ocupă şi a impactului 
asupra costului. 

® Am putea scrie despre diagrama scatter: „A fost examinată o diagramă scatter pentru 
relaţia dintre abilităţile muzicale şi matematice. Nu există nici o dovadă privind o 
relaţie curbilinie sau asupra influenţei avute de rezultatele atipice”. 



Q Regresia 

fjl Fredicţia cu precizie 



Rezumat 

* Acolo unde există o relaţie între două variabile, sunt posibile estimarea sau 
predicţia scorului unei persoane la o variabilă pornind de la scorul obţinut la 
cealaltă variabilă. Cu cât este mai puternică corelaţia, cu atât mai bună este 
predicţia. 

s Regresia poate fi folosită pe date asemănătoare celor utilizate pentru coeficienţii 
de corelaţie. Totuşi, este mult mai rar utilizată, parţial din cauza problemei de 
comparaţie între valorile obţinute pentru seturi diferite de variabile. (Mărimea lui 
beta poate fi folosită dacă este necesară o asemenea comparaţie.) 

a Variabila dependentă într-o regresie este cea a cărei valoare va fi estimată. 
Este cunoscută, de asemenea, ca variabilă-criteriu, variabila prezisă sau 
variabila Y 

■ Variabila independentă este variabila folosită pentru a realiza predicţia. Este 
cunoscută, de asemenea, ca variabila-predictor sau variabila X. 

m Este nevoie de o mare atenţie pentru a nu confunda variabila independentă cu 
cea dependentă. Acest lucru se poate întâmpla uşor în cazul unei regresii simple. 
Cel mai bun mod de a evita aceste probleme este de a examina scatterplot-ul 
sau diagrama scatter a relaţiei dintre cele două variabile. Asiguraţi-vă că axa 
orizontală X este variabila independentă şi că axa verticală Y este variabila 
dependentă. Se poate investiga care este punctul de tăiere, aproximativ, de pe 
diagrama scatter şi să vă faceţi o idee asupra valorii pe care ar trebui să o aibă 
panta. Punctul de tăiere este punctul în care panta se intersectează cu axa 
verticală. Aceste estimări pot fi comparate cu valorile calculate pentru a ne 
asigura că nu există nici o eroare. Dacă apar probleme, motivul cel mai probabil 
este acela că variabilele dependente şi independente au fost încurcate. 

a Tehnica simplă de regresie descrisă în acest capitol exprimă relaţiile la nivelul 
unităţilor de măsură originale ale variabilelor implicate. Deci, dacă două studii 
diferite folosesc variabile uşor diferite, este dificil să compari rezultatele folosind 
această formă de regresie. 

■ într-o regresie, relaţia dintre două variabile este descrisă matematic de panta 
dreptei care se potriveşte punctelor diagramei de împrăştiere împreună cu punctul 
în care linia de regresie intersectează axa (verticală) a diagramei 1 scatter. Prin 
urmare, relaţia dintre cele două variabile necesită valoarea pantei (în mod normal, 
simbolurile £?sau b) şi aflarea punctului de tăiere Ia intersecţia cu axa verticală (în 
mod normai este dat simbolul a sau este descris ca o constantă). 
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® Regresia devine o tehnică mult mai importantă atunci când sunt folosite mai 
multe variabile pentru predicţia valorilor unei alte variabile. Aceste tehnici sunt 
cunoscute sub numele de regresii multiple (vezi capitolele 28 şi 29). Când 
variabila dependentă este o categorie nominală, atunci statistica potrivită va fi o 
formă de regresie logistică (vezi capitolul 32 şi 33). 

Vom ilustra procesarea unei regresii simple şi a unei diagrame de regresie cu datele 
din tabelul 8.1, care prezintă scoruri ale abilităţilor muzicale şi matematice pentru 10 
copii. Aceste date sunt identice cu cele folosite în capitolul anterior în cazul corelaţiei, 
în acest fel, veţi putea aprecia mai uşor diferenţele dintre corelaţie şi regresie. 


Tabelul 8.1. Scorurile abilităţilor muzicale şi matematice pentru 10 copii 



Scorurile abilităţilor muzicale formează criteriul sau variabila dependentă, iar cele 
ale abilităţilor matematice formează predictorul sau variabila independentă. în cazul 
regresiei, este esenţial să asociem criteriului sau variabilei dependente axa verticală (axa Y) 
a scatterplot-ului, şi predictorului sau variabilei independente axa orizontală (axaX). 

8.1. Introducerea datelor 

Dacă aţi salvat datele, selectaţi fişierul respectiv. Dacă nu, introduceţi datele încă o dată. 

Pasul 1 

în „Variable View” din „Data 
Editor" denumiţi primul rând 
„Music” şi al doilea „Math". 

înlăturaţi cele două zecimale 
schimbând cifra prezentă aici 
în zero. 
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Pasul 2 

în „Data V.svV oin „Data 
Editor” introouceţi datele 
pentru muzică în prima 
coloană şi cele pentru 
matematică în cea de-a 
doua coloană. —.—— 


8.2. Regresia simplă 


Pasul 1 

Selectaţi „Analyze”, **" 
„Rsgression" şi „Linear...’. 




«Mâl 



Pasul 2 

Selectaţi „Music” şi apoi 
apăsaţi butonul ► de lângă 
eticheta „Dependent:” pentru 
a introduce această variabilă 
în căsuţa variabilei 
dependente. 

Selectaţi „Math” şi apoi 
butonul 4 de lângă eticheta 
„Independent(s):" pentru a 
Introduce această variabilă în 
căsuţa variabilei(ior) 
Independente. 

Selectaţi „Sîatistics...”. 


• lliMMt Kpiiri'Mlou 
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Pasul 3 

Selectaţi „Confidence 
Intervals". 

Selectaţi „Continue". 

Apăsaţi „OK" din ecranu! 
precedent, care reapare. 


R^ e ,^C^, r f? MţxMtt , ; 


■ i -Continuo j 

mm 
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8.3. Interpretarea output-ului 


Acest ultim tabel cu rezultate conţine detaliile esenţiale pentru analiza regresiei. Este 
foarte uşor de inversat accidental variabila independentă cu cea dependentă. Verifi¬ 
caţi tabelul intitulat „Coeffîcients 3 ”. Sub acest tabel este afişat numele variabilei 
dependente. în acest caz, „Music” este variabila dependentă. Dacă a fost citit „Math” 
atunci aţi făcut o greşeală şi analiza trebuie refăcută pentru că valorile regresiei ar fi 
incorecte. 


Constanta este 8,425. Acesta este punctul în care 
linia de regresie intersectează axa verticală. 



Coeficientul nestandardizat Coeficientul standardizat al Intervalul de încredere ia 

al regresiei este -0,633. regresiei este -0,900. valori de la -0,833 la -0,383. 

Acesta semnifică faptul Acesta este mai mult sau însemnând că este foarte 

că, pentru fiecare creştere mai puţin coeficientul de probabil ca coeficientul 

cu 1 a variabilei „Math”, corelaţie Pearson dintre nestandardizat al populaţiei 

valoarea variabilei „Music" abilităţile muzicale şi cele să aibă valori cuprinse între 

descreşte cu -0,633. matematice. -0,833 şi -0,383. 



în regresii simple care implică două variabile, m mod convenţional se reportează ecuaţia 
de regresie ca o pantă (b) şi ca un punct de intersecţie (a) (vezi ISP, capitolul 8). SPSS-ui nu 
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urmează această terminologie. Din păcate, la acest moment output-u! aplicaţie SPSS este mult 
mai complex şi mai detaliat decât sofisticarea statistică observată la majoritatea studenţilor: 

■ B este panta. Panta liniei de regresie este denumită coeficient de regresie nestandardizat 
în SPSS. Coeficientul de regresie nestandardizat dintre variabilele „Music” şi „Math” 
este afişat sub B şi are valoarea -0,633, ceea ce, rotunjit la două zecimale, este -0,63. 
Acesta semnifică faptul că pentru fiecare creştere cu 1,00, a axei orizontale valoarea 
de pe axa verticală se modifică cu -0,633. 

® Intervalul de încredere de 95 % pentru aceşti coeficienţi este de la -0,88 (-0,883) la -0,38 
(-0,383). Deoarece regresia este bazată pe un eşantion, şi nu pe întreaga populaţie, 
există întotdeauna un risc ca acest coeficient de regresie obţinut pe eşantion să difere de 
cel al populaţiei. Intervalul de încredere de 95% arată intervalul pantelor de regresie în 
care putem fi siguri într-o proporţie de 95% că panta pentru populaţie se va găsi. 

* Punctul de intersecţie a este identificat în SPSS ca o constantă. Intersecţia este 
prezentată ca fiind „Constant” şi este 8,425, ceea ce, rotunjit la două zecimale, este 
8,43. Este punctul în care linia de regresie intersectează axa verticală y. 
ffl Intervalul de încredere pentru intersecţie este de Ia 6,753 la 10,097. Ceea ce înseamnă 
că, în funcţie de eşantion, este 95% probabil ca intersecţia populaţiei să se afle în 
intervalul de la 6,75 la 10,10. 

ffi Coloana numită „Beta” are valoarea -0,900. Aceasta este de fapt corelaţia Pearson 
între cele două variabile. Cu alte cuvinte, dacă transformaţi valorile avute în valori 
standard (scoruri z), panta regresiei şi coeficientul de corelaţie sunt acelaşi lucru. 

8.4. Scatterplot-ul de regresie 

Este în general recomandabilă cercetarea diagramei scatter pentru cele două variabile 
atunci când se realizează o regresie. Urmaţi paşii implicaţi în redactarea unei diagrame 
scatter aşa cum sunt descrişi în capitolul 7. 

Pasul 1 

Selectaţi „Graphs" şi 
„Scatter/Dot...\ 
















Sgatter/Dot 


W 


î -» î mi 


INTRODUCERE ÎN SPSS PENTRU PSIHOLOGIE 


Pasul 2 


Selectaţi „Define” din 
moment ce „Simple" 
este deja selectat. Se 
numeşte opţiunea 
predefinită. 


Pasul 3 


Selectaţi „Music" şi apoi 
apăsaţi butonul ► de 
lângă eticheta „V Axis:” 
pentru a introduce această 
variabilă în căsuţa 
variabilei-criteriu. 

Selectaţi „Math" şi apoi 

apăsaţi buîonui < _ ___ 

de lângă eticheta „X Axis:” 
pentru a introduce această 
variabilă în căsuţa 
variabilei-predictor. 

Apăsaţi „OK". 

Output-ul va fi identic cu 
cel pentru corelaţie din 
secţiunea 7.9. 


i.K'Y'Ajci.’*' 'V' 
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Pasul 4 

Pentru a încadra o linie 
de regresie în scatterpiot, 
daţi dubiu clic oriunde în 
interior şi se va 
deschide „Chart Editor". 




Selectaţi „Elements" 
şi „Fit Line at Total".. 

Selectaţi „Close” din 
fereasta „Properties” 




8.5. Interpretarea output-ului 


Punctele de pe scatterpiot sunt apropiate de linia de regresie (linia se 
potriveşte bine cu datele). în plus, punctele par să formeze o linie 
dreaptă (relaţia nu este curbilinie). De asemenea, nu este nici un 
semn care să indice valori atipice - în special ridicate sau scăzute. 


în regresie, axa verticală 
este variabila-criteriu sau 
dependentă. în acest caz, 
este „Music". Amesteca¬ 
rea axelor într-o regresie 
este o eroare des 
întâlnită. Dacă aţi făcut 
această greşeală, atunci 
începeţi încă o dată. 

Linia de regresie are o 
pantă negativă în acest 
caz; de exemplu, de la 
stânga sus spre dreapta 
jos. în consecinţă, B are 
o valoare negativă. 



Maths 


t 


în regresie, axa orizontală este variabila predictor sau independentă, 
în acest caz este „Math”. Amestecarea axelor într-o regresie este o 
eroare des întâlnită. Dacă aţi făcut această greşeală, atunci refaceţi 
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* Linia de regresie oblică, de la stânga sus spre dreapta jos, indică o relaţie negativă 
între cele două variabile. Amintiţi-vă că numai în cazul în care axele intersectează în 
punctul zero atât axa verticală, cât şi pe cea orizontală, atunci interpretarea riscă să 
fie greşită. 

* Punctele par relativ apropiate de linie, ceea ce sugerează că Beta (corelaţia) ar trebui 
să fie un număr mare (negativ) şi că intervalul de încredere este relativ mic. 


8.6. Raportarea output-uluî 

Deşi tot output-ul din SPSS este pertinent pentru un utilizator sofisticat, mulţi dintre 

utilizatori ar prefera varianta simplificată la această etapă. 

® Având acestea în minte, am putea scrie despre analiza din acest capitol în felul 
următor: „Diagrama scatterplot a relaţiei dintre abilităţile matematice şi muzicale 
sugerează o relaţie liniară negativă între cele două variabile. Este posibilă predicţia 
cu acurateţe a abilităţii muzicale a unei persoane cunoscând abilitatea sa matematică. 
Ecuaţia este Y’ = 8,43 (+ / -0.633X), unde X este valoarea individului pentru abilitatea 
matematică şi Y’ cea mai bună predicţie a valorii pentru abilitatea muzicală.” 

■ O alternativă ar fi afişarea scatterplot-ului şi scrierea dedesubt a = 8,43 şi B - -0,63. 

* Pot fi adăugate şi intervalele de încredere, după cum urmează: „Intervalul de 
încredere 95% pentru panta liniei de regresie este de la -0,88 la -0,38. Deoarece 
acest interval de încredere nu include valoarea 0, panta diferă semnificativ faţă de o 
linie orizontală dreaptă”. Totuşi, aceasta este o interpretare relativ sofisticată pentru 
un începător în domeniul statisticii. 



■ Eşantionarea aleatorie este un aspect-cheie al statisticii. Acest capitol explică 
cum poate fi generată rapid eşantionarea aleatorie. Aceasta nu este o proce¬ 
dură folosită des în analiza statistică, dar poate oferi o experienţă folositoare 
despre natura proceselor de randomizare. 

a Se poate înţelege mai bine statistica inferenţială şi eşantionarea prin folosirea 
de eşantioane aleatorii de date pentru cercetarea variabilităţii rezultatelor pentru 
analize statistice viitoare cu aceste eşantioane aleatorii. Variaţia caracteristicilor 
eşantioaneSor este cunoscută ca eroare de eşantionare şi este baza statisticii 
inferenţiale. 

■ Eşantionarea aleatorie poate fi utilizată cu seturi imense de date pentru a 
întreprinde analize preliminare. în trecut, când timpul de calculator era scump, 
iar viteza de procesare lentă, acestea erau de mare ajutor. 

■ Fiţi atenţi la căsuţele de dialog pe măsură ce parcurgeţi acest capitol Veţi 
vedea opţiuni care vă permit selectarea eşantioanelor pe bază de alte criterii, 
cum ar fi datele la care participanţii au fost intervievaţi. 

în acest capitol este ilustrată selecţia de eşantioane aleatorii dintr-un set de valori. 
Scopul de bază este acela de a permite celor care studiază statistica pentru prima dată să 
încerce eşantionarea aleatorie pentru a putea avea o imagine despre distribuţiile eşan- 
tionelor. Aceasta ar trebui să conducă spre o’mai bună apreciere a estimării în statistică 
şi a fragilităţii care poate submina considerabil proceduri matematice greoaie. Vom ilustra 
generarea unui eşantion aleatoriu dintr-un set de date constând în scorurile la testul de 
extroversiune ale unui număr de 50 de piloţi de linie aeriană, prezentate în tabelul 4.1. 

Tabelul 4.1. Rezultatele obţinute la evaluarea extroversiunii 
pentru 50 de piloţi de linie aeriană 
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9.1. Selectarea unui eşantion aleatoriu 


Pasul 1 

Dacă aţi salvat datele, 
selectaţi fişierul. Dacă nu, 
introduceţi datele din nou. 

Selectaţi „Data” şi „Select 
Cases...". 





Pasul 2 



Selectaţi „Random sample 
of cases”. 

Selectaţi „Sample". 




Pasul 3 



Pentru a selecta un procent de 
aproximativ 10% din toate cazuriie. 
introduceţi 10 în căsuţa de lângă 
„Approximately”. 

Pentru a selecta exact cinci 
cazuri, selectaţi „Exactly" 
introduceţi „5” cazuri din 
„50". 


Selectaţi „Continue". 


Apăsaţi „OK" din ecranul 
precedent, care reapare. 


9.2. Interpretarea rezultatelor 


Cazurile care au fost 
selectate nu au o linie 
diagonală peste numărul 
cazului, şi au cifra „1” în 
noua coloană creată, 
denumită „filter_$". 

Cazuriie care nu au fost 
selectate au o linie 
diagonală peste numărul 
cazului, şi cifra 0 în noua 
coloană creată, denumită 
„filter_$”. 



9.3. Analiza statistică pe un eşantion aleatoriu 



Pasul 1 

Pentru a analiza acest 
eşantion, selectaţi 
„Analyze" şi apoi analiza 
dorită cum ar fi 
„Descriptive Statistics" 
„Descriptives...”. 
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Pasul 2 



Selectaţi „Extrav" şi 
apăsaţi butonul < 
pentru a introduce 
variabila „Extrav" în lista 
de variabile. 

Apăsaţi „OK”. 


Descriptiva Statistica 



N 

Minimum 

Maximum i 

Mean 

Std. Devlaîlon 

Extrav 

Valid N (iistwise) 

7 

7 

i 

5 ■ 

3.29 

1.496 


Observaţi că au fost selectate 7 cazuri. Dacă s-ar fi cerut exact 10%, atunci 5 
cazuri din 50 ar fi trebuit specificate la pasul 3 de la secţiunea 9.1, 




eiectarea cazurilor 


Rezumat 

® Acest capitol explică maniera de selectare a unui anumit subgrup din eşantion. 
De exemplu, veţi dori să analizaţi datele referitoare numai la tineri sau numai la 
femei. 

■ Este posibil să selectaţi subgrupuri bazându-vă pe criterii multipie. 

* Câteodată, utilizarea subgrupurilor conduce la o mult mai clară înţelegere a 
tendinţelor existente în date, decât ar fi fost posibilă dacă, de exemplu, s-ar fi 
folosit tabelele de asociere după sex. 

Câteodată vom dori să realizăm calcule pe subgrupuri din eşantionul nostru. De 
exemplu, am putea dori să corelăm abilităţile muzicale şi cele matematice Ia fete şi băieţi 
separat (a), la copiii mari şi ia cei mici separat (b), la fetele şi băieţii mari şi mici separat (c). 
Pentru a face acest lucru, trebuie să avem un cod pentru gen şi vârstă, cum ar fi „1” 
pentru fete şi „2" pentru băieţi. De asemenea, trebuie să decidem care este vârsta de 
separare pentru a determina cum sunt încadraţi copiii în grupul cu vârsta mai mică şi în 
grupul cu vârsta mai mare. Vom folosi vârsta de 10 ani ca limită fixă, copiii de 9 ani sau 
mai puţin încadrându-se în grupul cu vârstă mică, iar cei de 10 ani sau mai mulţi 
încadrându-se în grupul cu vârstă mare. Apoi va trebui să selectăm pe rând cele două 
grupuri şi să efectuăm calculele. Vom ilustra această selecţie a cazurilor folosind datele din 
tabelul 10.1, care prezintă rezultatele la muzică şi matematică pentru zece copii, alături 


Tabelul 10.1, Valorile numerice pentru abilităţile la muzică şi matematică 
pentru 10 copii, împreună cu codul pentru sex şi vârstă 
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de codul pentru gen şi vârstă (valon * pentru abilităţile muzicale şi matematice sunt 
identice cu cele prezentate anterior în -abelui 7.1). 

Evident, selecţia limitei fixe este importantă. Trebuie să fiţi atenţi !a excluderea 
neprevăzută a unor cazuri. 


10.1. Introducerea datelor 


Pasul 1 


Dacă aţi salvat fişierul de date de 
la capitolul 7, selectaţi acel fişier 
şi definiţi noi variabile în „Variable 
View" din „Data Editor". 

Dacă nu, definiţi-vă cele patru 
variabile. 

înlăturaţi cele două zecimale. 


p] 


mmmâ 



d 

Mtisic 

Numeric 

8 

0 


Maths 

Numeric 

8 

0 

■P 

Sex 

Numeric 

B 

0 


Age 

Numeric 

S*dEL 

0 


Salvaţi acest fişier pentru utilizare 
în capitolele 15 şi 16. 



10.2. Selectarea cazurilor 



Pasul 1 

Selectaţi „Data" şi 
„Select Case...". 
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Pentru a selecta fetele, 
selectaţi „Sex" şi apoi 
butonul ► 

Selectaţi „=" şi „1”. 
Alternativ introduceţi 
„Sex = 1". 

Selectaţi „Continue". 

Selectaţi „OK” din ecranul 
precedent, care reapare. 

Duceţi la bun sfârşit 
analiza dorită (de 
exemplu, corelaţia). 


Pentru a selecta băieţii, 
selectaţi „Data”, „Select 
Cases...” şi „lf\ 

Evidenţiaţi „1” şi 
înlocuiţi-l cu „2". 

Selectaţi „Continue" şi 
apoi „OK”. 

Faceţi analiza (de 
exemplu, corelaţia). 


Pasui 2 


„If cormu,on is 
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Pentru a selecta fetele de mai 
mult de 9 ani, selectaţi „Data", 
„Select Cases...” şi Jf". 


Marcaţi „<=” şi înlocuiţi-l cu 
„>’ (semnul „mai mare"). - 


Pentru a vizualiza sau a aminti 
semnificaţia semnului, 
deplasaţi cursorul pe el şl daţi 
cile dreapta. 


Selectaţi „Continue" şi apoi 
„OK". 


Realizaţi analiza (de exemplu, 
corelaţia). 


Pentru a selecta fetele de 9 
sau mai puţini ani, selectaţi 
„Data", „Select Cases..." şi „ir 


Evidenţiaţi „2" şi 
înlocuiţi-l cu „1". 


Selectaţi „Age”, buto' 
nul ►,„<=" (mai mic sau 
egal) şi „9". Sau introduceţi 
de la tastatură. 


Selectaţi „Continue" şi apoi 
„OK". 


Realizaţi analiza (de 
exemplu, corelaţia). 



Rezumat 

■ Eroarea standard este un indice pentru variabilitatea mediilor în cazul mai multor 
eşantioane extrase din populaţie. Nu este nimic altceva decât abaterea standard, 
dar aplicată eşantioanelor în loc de scoruri. Cu alte cuvinte, eroarea standard 
este media măsurii cu care media eşantioanelor diferă faţă de media populaţiei 
din care au fost extrase. 

s Este folosită în cea mai mare parte ca un pas intermediar în alte tehnici statis¬ 
tice, cum ar fi Testul t. Nu este mare nevoie de calculul erorii standard de sine 
stătător, din moment ce aduce foarte puţin sau nimic nou faţă de calculul abaterii 
standard sau al varionţei. 

b Cu toate acestea, poate fi folosită la fel ca abaterea standard şi varianţa ca un 
indice pentru variabilitatea scorurilor unei variabile. Un cercetător cu experienţă 
găseşte varianţa, abaterea standard şi eroarea standard la fel de folositoare ca 
indicatori ai valabilităţii scorurilor. 

a Eroarea standard este un concept important pentru calcului intervalelor de 
încredere. într-adevăr, apare în multe contexte în care atenţia este îndreptată 
spre caracteristicile eşantioanelor mai degrabă decât spre cele al© scorurilor. 

■ Există două versiuni ale erorii standard. Eroarea standard aplicată unui set de 
scoruri şi cea estimată, care este folosită atunci când se încearcă estimarea 
erorii standard a populaţiei din cea a unui eşantion. De fapt, SPSS calculează 
numai eroarea standard estimată. De aici încolo, pentru eroarea standard în 
ouput-ul SPSS-ului citiţi eroarea standard estimată. 

Calcularea erorii standard estimate pentru medie este ilustrată cu un set de şase 

scoruri ale respectului de sine, prezentate în tabelul 11.1. 


Tabelul 11.1. Date pentru exemplul de eroare standard 
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11.1. Introducerea datelor 


ntroduceţi datele în 
,Data Editor" 


Etichetaţi variabila 
„Esteem". 


11.2. Eroarea standard estimată a mediei 

a* 


Pasul 2 


Pasul 1 

Selectaţi „Analyze”, 
„Descriptive Statistics 
şi „Descriptive...". 


Selectaţi „Esteem” şi 
butonul < pentru a 
duce variabila „Esteem" 
In „Variabiie(s):”. 


Selectaţi „Options... 


EROAREA STANDARD 


Pasul 3 

Selectaţi „$.E. mean”. 

Selectaţi „Continue". 

Apăsaţi „OK” din ecranul 
anterior, care reapare. 


mW&M 
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11.3. Interpretarea output-ului 


Descriptive Statistics 



N 

Minimum 

Statistic 

Statistic 

6 

6 

3 




Esteem 

Valid N (listwise) 


Eroarea standard (estimată) pentru medie a acestui eşantion este 
0,577. Este o indicaţie a mediei cu care mediile eşantioanelor diferă 
de media populaţiei din care au fost extrase. 

Tabelul oferă valoarea erorii standard a mediilor eşantioanelor ca fiind 0,58, fiind 
rotunjită la două zecimale. Aceasta este valoarea medie cu care mediile eşantioanelor 
(N = 6) diferă faţă de media populaţiei. 

Este o estimare bazată pe un eşantion şi ar trebui denumită estimarea erorii standard. 
Tabelul include şi alte informaţii cum ar fi media (5,00), abaterea standard estimată 
a populaţiei bazată pe acest eşantion, valorile minime şi maxime ale datelor. 

Ultima coloană oferă abaterea standard (estimată) a celor şase scopuri, care este 1,41. 


11.4. Raportarea output-ului 

în general, în statistica psihologică nu se raportează eroarea standard pentru mediile 
eşantioanelor ca un fapt In sine. Ar fi mai obişnuită raportarea ca parte a anumitor teste 
de semnificaţie. Totuşi, în multe circumstanţe este la fel de informativă ca şi varianţa sau 
abaterea standard a unui eşantion, pentru că poartă o relaţie simplă cu ambele. 





















Testul t 

Compararea a două eşantioane 
de scoruri corelate/relationate 


Rezumat 

® Testul /este folosit pentru evaluarea semnificaţiei statistice a diferenţei dintre 
mediile pentru două seturi de scoruri. Astfel, ajută la elucidarea întrebărilor 
comune ale cercetătorilor dacă valoarea medie pentru un set de scoruri diferă 
de valoarea medie pentru alt set de scoruri. 

■ Semnificaţia statistică este evaluată folosind valabilitatea în datele disponibile 
pentru a evalua probabilitatea ca cele două medii să fie diferite dacă nu ar exista 
nici o deosebire fundamentală între cele două eşantioane. Ipoteza de nul sugerează 
că nu este nici o diferenţă între mediile eşantioanelor. Despre diferenţele între 
mediile eşantioanelor, care ar fi foarte neobişnuite, aleatorii, dacă ipoteza de nul 
ar fi adevărată, se spune că sunt semnificative statistic. Ele ne ghidează spre 
acceptarea ipotezei conform căreia există o diferenţă reală între cele două medii 
şi este puţin probabil ca aceasta să fie un efect aleatoriu datorat eşantionării. 

® Pentru că în cercetare, în mod invariabil, se lucrează cu eşantioane de oameni 
extrase din populaţia latentă, trebuie să estimăm dacă orice diferenţă pe care o 
obţinem între cele două seturi de valori este semnificativă statistic. Cu alte 
cuvinte, este diferenţa de medie obţinută atât de diferită de o diferenţă zero 
încât să fie puţin probabil ca eşantioanele să provină din aceeaşi populaţie? 

* Există două variante al Testului /. Una este folosită când cele două seturi de 
scoruri ce trebuie comparate provin dintr-un singur eşantion sau când coefi¬ 
cientul de corelaţie între cele două seturi este mare. Această variantă este 
cunoscută ca Testul /pentru eşantioane perechi. Cealaltă versiune a Testului /este 
utilizată în momentul în care două seturi diferite de valori provin din grupuri 
diferite de participanţi. Faceţi referinţă la capitolul următor dacă cele două medii 
pe care doriţi să le comparaţi provin din grupuri distincte de participanţi. 

® Dacă aţi folosit o procedură de echivalare pentru a face perechi de oameni 
cu caracteristici similare, atunci veţi folosi, de asemenea, Testul /pentru eşantioane 
perechi din acest capitol - în mod special în cazul în care cele două seturi de 
valori sunt corelate semnificativ. 

® Introducerea datelor pentru variabilele perechi şi independente (neperechi) este 
foarte diferită în SPSS, deci aveţi grijă să planificaţi analiza înainte de intro¬ 
ducerea datelor pentru a evita problemele şi munca inutilă. 

® Dacă aveţi mai mult de două seturi de valori de comparat, faceri referire la 
capitolul 21 la analiza de varianţă cu eşantioane perechi. 


TESTUL T: COMPARAREA A DOUĂ EŞANTIOANE Ut SCORURI CORELATE... 
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■ Testul / descris în acest capitol este cunoscut ca Testul / pentru eşantioane 
perechi. Fundamentai, aceasta înseamnă că cele două seturi de scoruri provin 
dintr-un singur eşantion de participanţi. Ar trebui să existe o corelaţie între 
valorile celor două măsurări deoarece, din alt punct de vedere, aceste două 
seturi de scoruri nu sunt corelate. 

a Testul / pentru eşantioane perechi lucrează optim dacă distribuţia diferenţelor 
dintre cele două seturi de valori se prezintă, aproximativ, sub formă de clopot 
(asta se întâmplă dacă avem de-a face cu o distribuţie normală). Dacă distribuţia 
este foarte diferită de forma de clopot, ar trebui luată în considerare utilizarea 
unei tehnici statistice relaţionate nonparametrică pentru eşantioane perechi, 
cum ar fi testul de perechi Wilcoxon (vezi capitolul 18). 

Procesarea unui Test t este ilustrată cu datele din tabelul 12.1, care arată numărul de 
contacte vizuale avute de aceiaşi bebeluşi cu mamele lor la 6 şi 9 luni. Scopul acestei 
analize este de a vedea dacă numărul contactelor vizuale se modifică între aceste vârste. 


Tabelul 12.1. Numărul segmentelor de un minut cu contact vizual la vârste diferite 



12.1. Introducerea datelor 
Pasul 1 

în „Variabie View" din „Data 
Editor" etichetaţi primul — 
rând „Six_mths" şi al doilea 
rând „Nîne_mths". 

Înlăturaţi cele două — 
zecimale, schimbând cifra 
prezentă cu 0. 
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Pasul 2 

în „Data View" din „Data 
Editor" introduceţi dateie 
în primele două coloane. 

(Salvaţi acest fişier pentru 
utilizare în capitolul 18.) 




T COMPARAREA A DOUĂ EŞANTIOANE DE SCORURI CORELATE... 


12.3. Interpretarea outpuMi!^ 


Palred Samplos Statistica 






Std. Error 


Mean 

N 

Std, Deviation 

Mean 

Pair Six_mths 

5.25 

8 

1.909 

.675 

1 Nine_mths 

6.75 

8 

—. /— 

2.053 

---- 

.726 


Primul tabel arată media, numărul de cazuri şi abaterea standard pentru cele 
două grupuri. Media pentru „Six_mths” este 5,25 şi abaterea standard este1,909. 
Cele două abateri standard sunt foarte similare, ceea ce este un avantaj. 


Palred Samples Correlations 


Pair 1 Six_mths & Nlnsjriths 


N 

Correlation 

Sig. 

8 | 

.419 ! 

.301 


Al doilea tabel arată gradul în care cele două seturi de valori sunt corelate. Corelaţia dintre ele 
este 0,419. Aceasta este o corelaţie medie, şi totuşi nesemnificativă, pentru că nivelul de semni¬ 
ficaţie este mai mare ca 0,05. Testeie relaţionale cum ar fi Testul /pentru eşantioane perechi ar 
trebui să aibă o corelaţie substanţială între cele două seturi de scoruri. Fiţi atenţi, acest tabel nu 
este testul de semnificaţie. Este o greşeală comună, printre începători, să se confunde această 
corelaţie dintre cele două variabile cu semnificaţia diferenţei dintre cele două variabile. 

Primele trei coloane ce conţin cifre sunt componentele fundamentale ale calcului unui Test / 
relaţionat. Media de -1,500 este de fapt diferenţa dintre mediile pe 6 şi 9 luni, deci în realitate 
este media diferenţei. Valoarea lui /este bazată pe această medie a diferenţei (-1,500), divizată 
cu eroarea standard a mediei (0,756). Calculul oferă valoarea lui / (-1,984). 


Palred SamptM Test 



Al treilea şi ultimul tabel oferă valoarea pentru / (-1,984), gradele de libertate (7) şi nivelul de 
semnificaţie, two-tailed (0,088). Pentru că nivelul de semnificaţie este mai mare ca 0,05, această 
diferenţă nu este semnificativă. Nivelul one-tailed este obţinut prin divizare cu 2. şi este 0,044, 
fiind semnificativ. Totuşi, dacă diferenţa nu este evaluată anterior colectării datelor pe baza unor 
raţiuni teoretice şi/sau empirice solide, numai Testul two-tailed este potrivit. 




























“ în primul tabel din output, media numărului de contacte vizuale la 6 luni ( Six mths”) 
şi la 9 luni ( Nine_mths”) este afişată sub „Mean. Aşadar, media numărului de 
contacte vizuale este 5,25 la 6 luni şi 6,75 la 9 luni. 

* M de îa ou ? Mt COnţine coeficienţii de corelaţie (Pearson) între cele două 

variabile (de contacte vizuale la 6 luni şi de contacte vizuale la 9 luni). în mod ideal 
această valoare ar trebui să fie considerabilă (în realitate, este 0,419) şi semnificativă 
sta-tistic (ceea ce nu este de fapt, având un nivel de semnificaţie two-tailed de 0,301). 
Testul t pentru eşantioane perechi presupune ca cele două variabile să fie corelate şi 
aţi putea descoperi că Testul t pentru eşentioane independente (capitulul 13) este mai 
potrivit pentru acest caz. 

» în al treilea tabel de la output, diferenţele dintre cele două valori medii sunt prezentate 
pe coloana Mean” de Ia „Paired Differences” şi eroarea standard a acestei medii pe 
coloana Std. Error Mean”. Diferenţa dintre cele două medii este -1,50 şi eroarea 
standard estimată mediilor pentru acest eşantion este 0 76 

85 a ' a difer f n * ei dintre ^difle celor două eşantioane, gradele sale de libertate şi 

mvelul de semnificaţie two-tailed sunt, de asemenea, în acest tabel. Valoarea î este - 
1,984, care are un nivel de semnificaţie (two-tailed) de 0,088 cu şapte grade de libertate. 

12.4. Raportarea output-ului 

® Am prezenta aceste rezultate după cum urmează : „Media numărului de contacte 
vizuale Ia 6 lum (M - 5,25, SD = 1,91) şi la 9 luni (M = 6,75, SD = 2,05) nu 
diferă semnificativ (t = -1,98, DF = 7, two-tailed p = 0,088)”. 

® Pentru a fi consecvenţi, în această carte vom prezenta nivelul dc probabilitate exact, 
pentru rezultate nesemnificative precum cele de mai sus. Totuşi, este în egală măsură 
acceptată raportarea ca „p > 0,05” sau NS (prescurtare de la nesemnificativ). 

. serva î x că rezultatele ar fi fost statistic semnificative pentru un test de o singură 
ipoteză (one-tailed). Totuşi, acest lucru ar fi trebuit să fie anticipat cu anumite 
argumente solide înainte de aflarea datelor. în acest caz s-ar fi putut scrie despre 
efect: „Cele două medii diferă semnificativ într-o direcţie anticipată (/ = 1 98 
DF = 7, p (one-tailed) = 0,044)”. 

» încă o dată, pentru a fi consecvenţi în această carte vom raporta nivelul exact de 
semnificaţie pentru rezultatele semnificative, acolo unde este posibil. Observaţi că 
SPSS-uI afişează nivelul de semnificaţie ca „,000”, deci va trebui să-I prezentăm ca 
„p < 0,001”, dm moment ce nivelul exact nu este oferit. Este în egală măsură 
acceptată raportarea probabilităţilor semnificative ca „p < 0 005” d < 0 01” si 
„p < 0,001”, după caz. ' F ’ § 

M Dacă P refera fi să utilizaţi intervalele de încredere, va trebui să prezentaţi rezultatele 
ca : „Media numărului de contacte vizuale la 6 luni este 5,25 (SD = 1,91) şi la 9 luni 
6,75 (SD = 2,05)”. Diferenţa este 1,50. Intervalul de încredere 95% pentru această 
diferenţă este de la -3,29 îa 0,29. Deoarece intervalul de încredere trece prin 0,00, 

_ ferenţa nu este statistic semnificativă la nivelul de semnificaţie two-tailed de 5%. 
Unu statisticieni susţin mai mult raportarea cu intervale de încredere d.eUţ cea cu 

?.wvele de semnificaţie. Totuşi, rămâne o metodă neobişnuită prezentarea m.ervaleîor 
de încredere. 



Rezumat 

b Testul / pentru eşantioane independente este utilizat pentru a calcula dacă 
mediile pentru două seturi de variabile sunt diferite semnificativ una faţă de 
cealaltă. Este versiunea de Test /cel mai des folosită. Semnificaţia statistică 
presupune că cele două eşantioane diferă până ia un punct, această diferenţă 
nefiind datorată întâmplării şi nefiind o consecinţă a eşantionării. Variabilitatea 
inerentă a acestor variabile de date este utilizată pentru a estima probabilitatea 
apariţiei oricărei diferenţe între cele două medii, dacă nu ar fi nici o diferenţă 
între cele două eşantioane. 

s Testul / pentru eşantioane independente este utilizat atunci când cele două 
seturi de variabile provin din două eşantioane diferite de oarheni. (Revedeţi la 
capitolul anterior pentru Testul / relaţional dacă valorile provin dintr-un singur 
set de oameni sau dacă aţi folosit o procedură de echivalare.) 
a Introducerea datelor pentru variabilele relaţionale şi nerelaţionate este foarte 
diferită în SPSS, deci aveţi grijă să planificaţi analiza înaintea introducerii datelor 
pentru a evita problemele şi munca inutilă. Totuşi, SPSS-ui este foarte flexibil şi 
erorile de acest tip sunt de obicei uşor de corectat folosind caracteristici de 
genul celor „cut-and-paste”. 

m Procedurile SPSS ai Testului / pentru eşanţioane independente sunt foarte 
folositoare şi depăşesc tratarea lor obişnuită de manual. Astfel, acestea includ 
o opţiune pentru calcularea Testului /atunci când varianţa celor două eşantioane 
de valori diferă semnificativ una faţă de cealaltă. Majoritatea manualelor suge¬ 
rează eronat faptul ca Testul /ar fi imprecis atunci când varianţele celor două 
grupuri sunt inegale. Această versiune adiţională a Testului /pentru eşantioane 
independente este rareori menţionată în manualele statistice, dar este extrem 
de utilă. 

a Dacă aveţi mai mult de două seturi de valori de comparat, faceţi referire la 
capitolul 20 la analiza pentru eşantioane de variaţie independente. 

Procesarea unui Test / pentru eşantioane independente este ilustrată cu datele din 
tabelul 13.1, care arată valorile la un test de emotivitate pentru 12 .copii ce provin din 
familii cu doi părinţi şi 10 copii ce provin din familii cu un părinte. în SPSS acest tip de 
Test t este denumit Testul l pentru eşantioane independente. Scopul analizei este de a 
aprecia dacă valorile emotivităţii sunt diferite pentru familiile cu doi părinţi faţă de cele 
cu un singur părinte. 
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Tabelul 13.1. Scorurile emotivităţii pentru copiii proveniţi din familii 
cu doi părinţi şi cu un singur părinte 



13.1. Introducerea datelor 


Pasul 1 

In „Variable View" din „Data 
Editor" etichetaţi primul rând. 
„Family*. Acesta va defini — 
cele două tipuri de familii. 

Etichetaţi al doilea rând,_ 

„Emotion". Acestea sunt 
rezultatele la testul de 
emotivitate. 


II Family Numeric 

1 $ Emotion Numeric 


înlăturaţi cele două zecimale, 
înlocuind cifra existentă cu zero. 


Pasul 2 

în „Data View” din „Data 
Editor" introduceţi valorile 
pentru cele două variabile 
în primele două coloane. 

Salvaţi acest fişier 
pentru utilizarea 
ulterioară în capitolul 18. 
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Priviţi cu atenţie pasul 2. Observaţi că sunt două coloane de date. A doua coloană 
(„Emotion”) conţine 22 de valori a ie testului de emotivitate de la ambele grupe de copii. 
Datele nu sunt păstrate separat pentru cele două grupe; valorile „1” din prima coloană 
indică, în exemplul nostru, copiii proveniţi din familii cu un singur părinte şi valorile 
„2” indică copiii proveniţi din familii cu doi părinţi. Aşadar este utilizată o singură 
coloană pentru variabila dependentă (în acest caz, emotivitatea/„Emotion”) şi altă 
coloană pentru variabila independentă (în acest caz, tipul de familie/„Family”). Deci 
fiecare rând în parte reprezintă un anumit copil şi variabilele sale dependente şi indepen¬ 
dente sunt introduse în două coloane separate în „Data Editor”. 


13.2. Efectuarea Testului t pentru eşantioane independente 


Pasul 1 



Selectaţi „Analyze",- 
„Compare Means" şi 
„Independent 
Samples T test...". N 


aphs Utteies/ Window Help 


Anefyte .■&> 

i .... 


‘Ore-WayANWA.i ‘ 


Pasul 2 


Selectaţi „Emotion” şi apoi 



apăsaţi butonul ► pentru a 
introduce această variabilă 
lista variabilelor de test. 


Selectaţi „Family" şi apoi apăsaţi 
butonul < pentru a introduce 
această variabilă în căsuţa 


rîmuninn VariahlfV 


Selectaţi „Define Groups...” 
pentru a defini cele două 
grupuri. 
























i. 1 oii 10L.UVj.lJL; 


Pasul 3 

Introduceţi valoarea „1" (codul pentru 
un singur părinte) alături de eticheta <s 
„Group - !:” şi valoarea „2” (codul 
pentru doi părinţi) alături de eticheta 
„Group2:". împărţirea grupurilor între 
cele două căsuţe este arbitrară. 

Selectaţi „Continue". - 

Apăsaţi „OK" din ecranul precedent, 
care reapare. 


mm 

UsjBjpeafisd^s * Continue jŞ 




13.3. Interpretarea output-ului 


Group Statistlcs 



Mean 

Std. Deviation 

Std. Error 
Mean 

9.50 

3.100 

.980 

13.42 

3.370 

.973 


Primul tabel arată, pentru fiecare grup în parte, numărul de cazuri, media şi abaterea 
standard. Media pentru un singur părinte este 9,50. Există în mod evident o diferenţă între 
cele două tipuri de familii. întrebarea următoare este dacă mediile diferă semnificativ. 


Valoarea lui feste pur şi simplu media diferenţei (-3,917) divizată cu 
eroarea standard a diferenţei (1,382), diviziune ce produce valoarea -2,813. 

Independent Samples Test jŞ 



levene's Test. 
for Equality ; 
of Variances j 



y //// 'lAes\ for Equality of Means 






A 





95% Confidence 
Interval of the 
Difference 


F 

! sig. 

t 

df 

Sig. (2-tailed) 

Difference 

Difference 

Lower 

Upper 

Equal variances 
assumed 

.212 

.650 

-2.813 

20 

.011 

-3.917 

1.392 

-6.821 

-1.013 

Equal variances 
not assumed 


/ 

-2.836 

19.77 



1.381 

-6.800 

-1.034 


Dacă valoarea semnificaţiei pentru Testul Levene 
este mai mare de 0,05, lucru care se întâmplă aici 
fiind 0,650, folosiţi informaţia de pe acest prim rând. 
Dacă valoarea semnificaţiei pentru Testul Levene 
este mai mică de 0,05, folosiţi informaţia de pe 
rândul al doilea. Ai doilea rând oferă cifrele pentru 
cazul în care varianţele sunt diferite semnificativ. 


Pentru varianţe egale, /este -2,813, care 
cu 20 de grade de libertate este semni¬ 
ficativ la 0,011 pentru nivelul two-tailed. 
Pentru a obţine nivelul one-îailed, 
divizaţi cu 2 nivelul anterior ş? obţineţi 
0.006, rotunjit la trei zecirr , - , ‘e. 


TESTUL T: COMPARAREA A DOUĂ EŞAN1 IOANE Du SCUKUKi NnCORELATE... Iii 

Output-ul pentru Testul t pentru eşantioane independente al SPSS-ului este în mod 

deosebit confuz, chiar şi pentru cei cu bună cunoaştere a statisticii. Motivul este acela că 

există două versiuni pentru acest Test t. Alegerea variantei de utilizat depinde de existenţa 

unei diferenţe semnificative între varianţele (estimate) ale celor două grupuri de scoruri. 

■ Examinaţi primul tabel de la output. Acesta conţine mediile şi abaterile standard ale 
scorurilor pentru variabila dependentă (emotivitatea) ale celor două grupuri. Observaţi 
că a fost adăugată, de către calculator, o cifră adiţională la numele coloanei ce 
conţine variabilă dependentă. Această cifră adiţională arată căruia dintre cele două 
grupuri îi corespund rândurile. Dacă aţi etichetat variabilele, valorile etichetelor vor 
fi afişate în tabel. 

B Pentru copiii proveniţi din familii cu doi părinţi („family 2”) valoarea medie a 
emotivităţii este 13,42 şi abaterea standard a valorilor emotivităţii este 3,37. Pentru 
copiii proveniţi din familii cu un singur părinte („family 1”) valoarea medie a 
emotivităţii este 9,50 şi abaterea standard a valorilor emotivităţii este 3,10. 

i în al doilea tabel apare linia „Levene’s Test for Equality of Variance” (Testul Levene 
pentru egalitatea variantelor),: Dacă valoarea probabilităţii este statistic semnificativă 
atunci varianţele sunt inegale,; în caz contrar ele sunt privite ca fiind egale. 

B Testul Levene pentru egalitatea varianţelor arată în acest caz faptul că varianţele sunt 
egale pentru că valoarea lui p este 0,650, deci nu este statistic semnificativă. 

■ în consecinţă veţi folosi rândul pentru „Equal variances assumed”. Valoarea t, gradele 
sale de libertate şi probabilitatea sunt afişate. Valoarea t pentru varianţe egale este 
-2,813, care, cu 20 de grade de libertate, are un nivel (two-tailed) de semnificaţie de 
exact 0 , 011 . 

ii Dacă Testul Levene pentru egalitatea varianţelor ar fi fost statistic semnificativ (de 
exemplu, 0,05 sau mai puţin) ar fi trebuit utilizată a doua linie a tabelului care oferă 
valorile Testului i pentru varianţe inegale. 

13.4. Raportarea rezultatelor 

H 

9 Am putea raporta rezultatele acestei analize sub forma: „Media pentru valorile testelor 
de emotivitate ale copiilor ce provin din familii cu doi părinţi (M - 13,42, SD = 3,37) 
este semnificativ mai mare (/ = -2,81, DF = 20, two-tailed p = 0,011) decât aceea a 
copiilor proveniţi din familii cu un singur părinte (M = 9,50, SD = 3,10)”. 

B Este neobişnuit să întâlniţi Testul t pentru varianţe inegale în rapoartele psihologice. 
Mulţi psihologi nu sunt conştienţi de existenţa lui. Aşadar, ce se va întâmpla dacă ar 
fi să folosiţi unul ? Pentru a clarifica lucrurile, vom scrie: „Din cauza faptului că 
varianţele pentru cele două grupuri sunt diferite semnificativ (F = 8,43," p < 0,05), 
a fost utilizat un Test t pentru varianţe inegale...” 

B Dacă preferaţi folosirea intervalelor de încredere, aţi putea scrie: „Diferenţa dintre 
valorile testelor de emotivitate ale copiilor ce provin din familii, cu doi părinţi 
(M - 13,42, SD = 3,37) şi cei proveniţi din familii cu un singur părinte (A/ = 9,50, 
SD = 3.1.0) este -3,92. Intervalul de încredere 95% pentru această diferenţă este de la 
-6,82 la -1,0!. Deoarece intervalul nu conţine punctul 0,00 diferenţa este statistic 
semnificativă la nivelul de semnificaţie two-tailed de 5 % ”. 














Testul chi-square 

Diferente între frecventele 

» » 

eşantioanelor 


Rezumat 

® în general, Testul chi-square este folosit pentru evaluarea existenţei unei diferenţe 
semnificative între două sau mai multe eşantioane care sunt formate din date 
de frecvenţă (date nominale). Cu alte cuvinte, este testul statistic uzual care 
analizează tabelele de asociere sau contingenţă pe baza a două variabile 
categoriale nominale. 

® De asemenea, poate fi folosit şi pentru testarea faptului că un singur eşantion este 
semnificativ diferit de o populaţie cunoscută. Această aplicaţie este cea mai puţin 
comună, doarece caracteristicile unei populaţii sunt rareori cunoscute în cercetare. 

■ Este extrem de important să reţineţi faptul că Testul chi-squaro analizează 
frecvenţe. Acestea nu trebuie niciodată să fie transformate în procente pentru a 
fi introduse în SPSS, căci vor da rezultate eronate atunci când se vor calcula 
valoarea şi semnificaţia lui chi-square. Trebuie să existe o distincţie foarte clară 
între acest lucru şi folosirea procentelor atunci când încercăm să interpretăm ce 
se întâmplă în cadrul unui tabel de contingenţă. 

® De asemenea, trebuie să aveţi în vedere că o analiză chi-square trebuie să 
includă datele fiecărui individ o singură dată. Aşadar, frecvenţele totale trebuie 
să fie egale cu numărul de persoane folosite în analiză. 

a Analizarea şi interpretarea tabelelor de contingenţă 2x2 sunt procese directe. 
Totuşi, interpretarea unor tabele de contingenţă mai mari nu este la fel de uşoară, 
căci poate necesita împărţirea tabelului într-o serie de tabele mai mici. Partiţionarea 
Testului chi-square, aşa cum este cunoscut procedeul, necesită, de obicei, 
adaptarea la nivelele de semnificaţie pentru a lua în considerare şi numărul de 
subanalize efectuate. Consultaţi un manual de statistică pentru mai multe detalii. 

® Acest capitol include şi Testul Fisher, care poate fi folositor în anumite condiţii 
atunci când datele dumneavoastră nu îndeplinesc condiţiile pentru chi-square 
(mai ales atunci când frecvenţele anticipate sunt prea mici). 

■ Este discutat şi Testul McNemar pentru semnificaţia modificărilor, care se află 
în strânsă legătură cu chi-square. 

a Linele variante ale Testului chi-square sunt folosite ca măsuri ale parametrului 
goodness-of-fit în unele dintre cele mai avansate tehnici statistice care vor fi 
discutate mai târziu în această carte, cum ar fi regresia logistică. Testul pentru 
goodness-of-fit nu face decât să evalueze relaţia dintre datele disponibile şi 
datele anticipate pe baza unui set de variabile predictori. în consecinţă, este 
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foarte Importantă înţelegerea adecvată a Testului chi-square, nu doar din cauza 
modului simplu în care se aplică, ci şi datorită rolului pe care îl îndeplineşte în 
cadru! tehnicilor statistice mai avansate. 


Tabelul 14.1. Relaţia dintre programul TV favorit şi viaţa sexuală 


immm 






Procesarea Testului chi-square folosind două sau mai multe eşantioane este exemplificată 
cu datele din tabelul 14.1 ( ISP, tabelul 14.8). Acest tabel arată care dintre cele trei tipuri 
de program de televiziune este preferat de către un eşantion de 119 adolescenţi de ambele 
sexe. Pentru a analiza cu ajutorul aplicaţiei SPSS un astfel de tabel cu date, mai întâi 
trebuie să introducem datele în „Data Editor” şi să ponderăm celulele după frecvenţele 
cazurilor pe care Ie conţin. 


■ Din moment ce avem de-a face cu un tabel deja format, este nevoie să efectuăm, mai 
întâi, procedura „Weighting cases” (vezi secţiunea 14.1). Altfel, aţi completa tabelul 
14.1 caz după caz, indicând cărei categorii de pe un rând şi cărei categorii de pe o 
coloană îi aparţine fiecare caz (vezi secţiunea 14.2). Trebuie să identificăm fiecare 
dintre cele şase celule din tabelul 14.1. Rândurile tabelului reprimă sexul 
participanţilor, în timp ce coloanele reprezintă cele trei tipuri de program de televi¬ 
ziune. Apoi, vom pondera fiecare dintre cele şase celule ale tabelului după numărul 
de cazuri pe care le conţin. 

■ Prima coloană, numită „Sex” în pasul 1 al secţiunii 14.1, conţine coduri pentru băieţi 
(1) şi fete (2). (Şi aceste valori au fost etichetate.) 

* A doua coloană, numită „Program”, conţine codurile celor trei tipuri de program de 
televiziune: telenovelă (1), dramă cu crime (2) şi nici una (3). (Şi aceste valori au 
fost etichetate.) 


14.1. introducerea datelor din tabelul 14.1, 
folosind procedura „Weighing cases” 


Pasul 1 

în meniul „Variabie View* ~~T77T 

din .Data Editor", etichetaţi 

primele trei coloane ----* - 

cu .Sex , „Program 

şi, respectiv, „Freq". “- 

îndepărtaţi cele două __ 

zecimale. ^---- 

Etichetaţi valorile „Sex” şi „Program". 




{1, Mala»).. 
* (1, Soap),,, 
Nons 




Introduceţi valorile 
adecvate în meniul 


£>ex 

1 

program 

1 

. :rreq 

27 


„Data View" din „Data yr ] 

m i 

2 

14 


Editor". Fiecare rând ^ 

l 

3 

19 


reprezintă una dintre 


2 

1 

. - - 1 

17 


cele şase celule din 

tabelul 14.1. i 

ps 

21 

2; 

331 




2j 

_ 3 

9; 



. 7 " 







Pasui 3 


Pentru a pondera aceste 
celule, selectaţi „Data" şi 
„Weight Cases...". 



Pasul 4 

Selectaţi „Freq”, „Weight 
cases by" şi apoi apăsaţi 
butonul ■*. 

Apăsaţi „OK”. —--- 
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14.2. Introducerea datelor din tabelul 14.1 caz cu caz 


Introduceţi valorile 

pentru cele două -—- : 

| CC 

Sex | 

■ • Proqram 1 


—P 

- >- 1 

i 


variabile în fiecare---"" 

dintre cele 119 cazuri. 


1 

1 

. 

i 

1 

1 


lA 

1 

1 
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Pasul 3 

Selectaţi „Chi-square”. 
Selectaţi „Continue". _ 


14.3. Efectuarea unui Test chi-square pe baza tabelului 14.1 


Pasul 2 


Pasul 1 

Selectaţi „Analyze",--— 
„Descriptive Statistics" şi 
„Crosstabs...” („Tabele 
de asociere..."). 


Selectaţi „Sex" şi 
apăsaţi butonul ► 
pentru „Row(s):” pentru 
a-l introduce în 
respectiva casetă. 

Selectaţi „Program" şi 
apăsaţi butonul ◄ 
pentru „Column(s):" 
pentru a-l introduce în 
caseta respectivă. 

Selectaţi „Statistics...”. - 
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Pasui 4 

Selectaţi „Cells’ 


Pasul 5 

în secţiunea „Counts" selectaţi _ 
„Expected". 

Selectaţi „Unstandardized" în 
secţiunea „Residuals". (Termenul 
„rezidual” se referă la diferenţe.) 

Selectaţi „Continue", 

Apăsaţi „OK” în ecranul 
anterior, care va reapărea. 


-'Peiccrt' 
T“ Rnw 
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14.4. Interpretarea output-ulus pentru Testul chhsquare 


Total 

60 

60.0 


59 

59.0 


119 

119.0 


De exemplu, frecvenţa sau numărul de / / / Trebuie să înţelegeţi ce 
fete care spun că preferi, telenovelele j / înseâmhâ cifrele pentru „Gount” 

este de 17, iar numărul anticipat de / din tabelul de asociere dintre 

probabilitate este de 21.8, iar diferenţa gen şi program. Acestea sunt 

dintre cele două valori este de -4,8. echivalente cu tabelul iniţia! cu 

date (tabelul 14.1). Puteţi 
transforma cifrele în procente 
(vedeţi captura de ecran din 
pasul 5 al secţiunii 14.3, unde se 
pot vedea trei opţiuni diferite - 
„Row", „Column” şi .Total" în 
meniul pentru procente). 

Alegerea procentajelor pe coloană 
v-ar ajuta, probabil, să vedeţi că 
băieţii tind să prefere teleno- 
velele şi categoria „nici una" mai 
mult decât fetele. Fetele tind să 
prefere programele cu crime mai 
mult decât băieţii. 



A! treilea şi cel din urmă 
tabel indică valoarea 
coeficientului (Pearson) 
chi-square (13,518), 
gradele de libertate (2) 
şi semnificaţia two-tailed 
(0,001). Din moment ce 
această valoare este 
mai mică de 0,05. 
coeficientul chi-square 
este semnificativ. 


Chi-Square Tasta 



a. 0 celule (.0%) au frecvenţa anticipată mai mică de 5. 
Frecvenţa aşteptată minimă este de 13,88. 
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B Al doilea tabel indică frecvenţele observate şi cele aşteptate ale cazurilor şi diferenţa 
(valoarea reziduală) dintre acestea pentru fiecare celulă, frecvenţa observată (numită 
„Count”) este prezentată mai întâi, iar apoi frecvenţa aşteptată (numită „Expected 
Count”). Frecvenţele observate sunt întotdeauna numere întregi, astfel încât ar trebui să 
fie uşor de localizat. Frecvenţele aşteptate sunt întotdeauna exprimate cu precizie de o 
zecimală, astfel încât se pot identifica foarte uşor. Aşadar, prima celulă din tabel (băieţii 
cărora le plac telenovelele) are o frecvenţă observată de 27 şi o frecvenţă aşteptate de 22,2. 

» Coloana finală din tabel (etichetată „Total") conţine numărul de cazuri din respectivul 
rând, urmat de numărul aşteptat de cazuri din tabel. Aşadar, primul rând are 60 de 
cazuri, număr care va fi întotdeauna indentic numărului de cazuri aşteptate (adică 60,0). 

B în mod similar, rândul final din acest tabel (etichetat „Total”) prezintă mai întâi 
numărul de cazuri din respectiva coloană urmat de numărul aşteptat de cazuri din 
tabel pentru coloana respectivă. Aşadar, prima coloană are 44 de cazuri, număr care 
va fi întotdeauna egal cu numărul aşteptat de cazuri (adică 44,0). 

» Valoarea chi-square, gradul său de libertate şi nivelul său de semnificaţie sunt afişate în 
al treilea tabel pe rândul care începe cu „Pearson”, cel care a elaborat acest test. Valoarea 
chi-square este de 13,518, care, rotunjită la un număr cu două zecimale, devine 13,52. 
Gradul său de libertate este 2, iar probabilitatea two-tailed exactă este de 0,001. 

* Sub acest tabel mai putem vedea şi mărimea „minimum expected count” a oricărei 
celule din tabel, care este 13,88 pentru ultima celulă (fetele cărora nu le place nici 
unul dintre programe). Dacă frecvenţa minimă aşteptată este mai mică decât 5,0, 
atunci trebuie să fim atenţi cu folosirea Testului chi-square. Dacă aveţi un tabel 2x2 
de tip chi-square şi apar frecvenţe anticipate reduse, ar fi mai bine să folosiţi Testul 
Fisher, pe care aplicaţia SPSS îl include în output în astfel de situaţii. 

14.5. Raportarea output-ului pentru Testul chi-square 

Există două modalităţi de descriere a acestor rezultate. Pentru ochiul neexperimentat, 

acestea pot părea foarte diferite, dar, practic, se reduc la acelaşi lucru: 

® Putem descrie rezultatele în felul următor: „A existat o diferenţă semnificativă între 
frecvenţele observate şi cele aşteptate în cazul adolescenţilor băieţi şi fete în ceea ce 
priveşte preferinţa lor pentru cele trei tipuri de program de televiziune — 13,51, 
DF = 2, p = 0,001)”. 

» O altă posibilitate, la fel de exactă, ar fi următoarea: „Există o asociere semnificativă 
între sex şi preferinţa pentru diferite tipuri de program de televiziune (z 2 = 13,51, 
DF - 2, p = 0,001)*’. 

a în plus, trebuie să raportăm şi direcţia rezultatelor. O modalitate de a face acest lucru 
ar fi să afirmăm că: „Fetele tind mai mult decât băieţii să prefere programe cu crime 
şi le plac mai puţin telenovelele sau ambele programe”. 

14.6. Testul Fisher exact 

Procedura chi-square procesează Testul Fisher exact pentru tabele 2x2 atunci când una 

sau mat multe dintre cele patru celule au o frecvenţă anticipată mai mică decât 5. Testul 

Fisher este procesat folosind datele din tabelul 14.2 (ISP, tabelul 14.15). 



a. Procesai numai penlru un tabel 2x2. 

b. 3 celule (75.0%) au o frecvenţă anticipată mai mică de 5. Frecvenţ 

Al treilea şi cel din urmă tabel din output-ul SPSS. Prezintă valorile statisticilor, gradul lor de 
libertate şi nivelele de semnificaţie ale acestora. Semnificaţia Testului Fisher exact pentru 
•scest tabel este de 0,091 la two-tailed şi de 0,063 la one-tailed. 


14.7. Interpretarea output-ului pentru Testul Fisher exact 

Sex * Memory Crosstabulatlon 


Sex Males 


Count 

Expected Count 
Residual 


Memory 


Photographic 

Non-photographic 

Total 

2 

7 

9 

3.9 

5.1 

9.0 

-1.9 

1.9 


4 

1 

5 

2-1 

2.9 

5.0 

1.9 : 

-1.9 


6 

8 

14 

6.0 

8.0 

14.0 


Females Count 

Expected Count 
Residual 


Total Count 

Expected Count 


Acesta este al doilea dintre cele trei tabele din output, în care se pot vedea frecvenţele 
observate („Count") şi cele aşteptate („Expected Count") pentru cele patru celule. 

Testele chi-square 


Pearson Chi-Square 
Continuity Correction 0 
Likelihood Ratio 


_her's Exact Test 

Linear-by-Linear 
Assoclation 
N of Valid Cases 
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14.8. Raportarea output-ului pentru Testul Fisher exact 

Bi Putem scrie după cum urmează: „Nu a existat nici o relaţie semnificativă între gen 
şi posesia unei memorii fotografice (probabilitate two-tailed exactă Fisher p — 0,091)” 
sau: „Bărbaţii şi femeile nu sunt diferiţi în ceea ce priveşte frecvenţa posedării unei 
memorii "fotografice (probabilitate two-tailed exactă Fisher p = 0,091)”. 

® Totuşi, având în vedere dimensiunea extrem de redusă a eşantionului, constatarea ar 
putea fi considerată, în cel mai bun caz, ca având o semnificaţie marginală sau ca o 
recomandare puternică să se efectueze studii mai aprofundate în acest sens, pentru 
stabilirea cu o mai mare certitudine a adevărului afirmaţiei că, în cazul fetelor, 
memoria fotografică este o caracteristică mai des întâlnită. 

14.9. Testul chi-square pentru un singur eşantion 

Procesarea unui Test chi-square pentru un singur eşantion este exemplificată folosind 
date din tabelul 14.3 (ISP , tabelul 14.18), care indică frecvenţele observate şi anticipate 
ale zâmbetelor la 80 de bebeluşi. Frecvenţele anticipate au fost obţinute în urma unui 
studiu anterior pe scară largă. 


Tabelul 14.3. Date pentru un Test chi-square pentru un singur eşantion 



Pasul 1 

Introduceţi datele în meniul 
„Data View" al .Data Editor"-ului, 
denumind variabilele şi 
îndepărtând cele două 
zecimale. 

Etichetaţi cele trei categorii. 

Ponderaţi celulele sau cazurile 
după frecvenţă („Freq”). 
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Pasul 2 

Selectaţi .Ana yze", 
Nonparametric Tests' 
şi .Chi-squa s...’. ^ 


Smilers}. 


Sjrvtval, 


Selectaţi „Category” şi apăsaţi 
butonul 4 pentru a introduce 
parametrul în caseta „Test — 
Variable List:". 

Introduceţi pe rând valorile 
anticipate ale frecvenţelor în 
caseta „Values:", apăsând — 
„Add” după fiecare dintre ele. 

Apăsaţi „OK”. 
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14.10. Interpretarea output-ului unui Test 
chi-square pentru un singur eşantion 


Category 



Smilers 

Non-smilers 

Unclassifiable 

Total 


Observed N 

Expected N 

Residual 

35 

40.0 

-5.0 

40 

32.0 

8.0 

5 

8.0 

-3.0 

80 





Primul dintre cele două tabele din output indică frecvenţele observate şi pe cele anticipate pentru 
cele trei categorii, împreună cu diferenţa sau valoarea reziduală dintre ele. Prima coloană conţine 
trei categorii, a doua coloană numărul N de frecvenţe observate, iar cea de-a treia numărul N de 
frecvenţe aşteptate, iar în cea de-a patra putem vedea diferenţa dintre frecvenţele observate şi 
anticipate. Frecvenţa observată a zâmbetelor este de 35, iar cea anticipată era de 40,0. 
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Frecvenţa anticipată minimă pentru fiecare celulă a fost de 8,0. 
Al doilea tabel arată valoarea lui chi-square (3,750), gradul 
de libertate (2) şi nivelul de semnificaţie (0,153). Din 
moment ce nivelul de semnificaţie este mai mic de 0,05, 
frecvenţele observate nu diferă semnificativ de cele 
anticipate datorită şansei (întâmplării). 

a, 0 celule (0%) aveau frecvenţe anticipate mal mici de 5%. 

14.11. Raportarea output-ului unui Test 

chi-square pentru un singur eşantion 

Putem descrie rezultatele analizei după cum urmează: „Nu a existat nici o diferenţă 
statistică între frecvenţele observate şi anticipate pentru cele trei categorii de zâmbet la 
bebeluşi = 3,75, DF = 2, p = 0,153)”. 


14.12. Testul McNemar 

Procesarea Testului McNemar este exemplificată folosind datele din tabelul 14.4 care 
indică numărul de adolescenţi care şi-au schimbat sau nu părerea în legătură cu urmarea 
studiilor universitare după ce au asistat la un discurs despre carieră care favoriza educaţia 
universitară (ISP , tabelul 14.19), Tabelul Indică numărul celor care voiau să meargă 
la universitate şi înainte şi după discurs (30), cei care voiau să meargă înainte de 
discurs, dar nu şi după (10), cei care voiau să meargă la universitate în urma discursului, 
dar nu înainte (50) şi cei care nu voiau să meargă la universitate nici înainte, nici după 
discurs (32). 


Test Statlstlcs 



Category 

Chi-Square a 

3.750 

df 

2 

Asymp. Sig. 

.153 


Tabelul 14.4. Studenţi care vor să urmeze cursuri universitare 
înainte şi după un discurs despre carieră 
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Pasul 2 


Selectaţi „Analyze", 
„Nonparametric Tests" şi 
„2 Related Samples.,.'*. 




* 


Pasul 3 



Selectaţi „After", „Before" şi 
apăsaţi butonui < pentru a • 
introduce aceste două 
variabile în caseta „Test 
Pair(s) List:”. 

Deselectaţi opţiunea 
„Wilcoxon". 

Selectaţi „McNemar”.-— 
Apăsaţi „OK”. -- 


(•..-cabmSj 
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14.13. Interpretarea output-ului pentru Testul McNemar 

Primul dintre cele două tabele prezintă frecvenţele cazurilor din cele patru celule, ca în 
tabelul 14.4. Cele.două valori, „1” şi „2”, nu au fost etichetate. 


After & Before 



Numărul celor care şi-au schimbat părerea în 
sensul că iniţial voiau să urmeze cursuri univer¬ 
sitare, iar după ce au ascultat discursul nu mai 
voiau să meargă la universitate (adică 10 ). 


Numărul celor care şi-au schimbat părerea, 
iniţial nevrând să meargă la universitate, 
iar apoi dorindu-şi acest lucru, în urma 
asistării la discurs (adică 50). 


Test Statlstlcs b 


A! doilea tabel din output indică numărul total N de 
cazuri (122), valoarea lui chi-square (23,350) şi nivelul 
de semnificaţie (0,000). Practic, nivelul de semnificaţie 
nu poate niciodată să fie zero. Valoarea sa este mai 
mică de 0,001. Din moment ce această valoare este 
mai mică decât 0,05, rezultă că este semnificativă. 
Acest lucru înseamnă că a existat o schimbare 
semnificativă la nivelul numărului de adolescenţi care 
şi-au schimbat părerea în legătură cu urmarea 
cursurilor universitare în urma asistării la o discuţie 
despre carieră în care se favoriza educaţia universitară. 



After & Before 

N 

122 

Chl-Square* 

25.350 

Asymp. Si 0 . 

.000 


a. Continuitatea corectată 

b. Testul McNemar 


14.14. Raportarea output-uiui pentru Testul McNemar 

Putem raporta rezultatele acestei analize după cum urmează: „S-a înregistrat o creştere 
semnificativă la nivelul numărului de adolescenţi care s-au hotărât să urmeze cursuri 
universitare după ce au asistat la discuţie (z 1 — 25,35, DF = 2, p < 0,001)”. 


14.15. Chi-square fără tabele deja formate 

în acest capitol, ne-am concentrat atenţia asupra modului în care putem analiza datele 
din tabele de contingenţă preexistente. Acesta este motivul pentru care avem nevoie de 
procedura de ponderare. Totuşi, nu veţi folosi întotdeauna tabele deja formate. Orice 
variabilă care este formată doar dintr-un număr mic de categorii nominale poate fi 
folosită pentru Testul chi-square. De exempiu, dacă doriţi să analizaţi relaţia dintre gen 
(codificat cu 1 pentru bărbaţi şi 2 pentru femei) şi vârstă (codificată cu 1 pentru cei cu 
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vârsta suu 20 de ani, 2 pentru intervalul de la 20 până la 30 de ani şi 3 pentru cei de peste 
40 de am), procedura este următoarea. 

■ Introduceţi codurile pentru sexe, de pildă, pentru 60 de cazuri, în prima coloană din 
„Data Editor”. 

* Introduceţi categoriile de vârstă pentru fiecare dintre aceste cazuri din rândul echivalent 
al următoarei coloane. 

■ Efectuaţi analiza chi-square. Nu mai este nevoie să urmaţi procedura de ponderare. 
Frecvenţele din celule vor fi calculate de SPSS. 
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Rezumat 

■ Câteodată, în cercetare, se poate întâmpla să nu aveţi setul complet de valori 
de la fiecare participant. Valorile lipsă „explică” calculatorului cum să facă faţă 
situaţiei. 

ai în mod tipic, atunci când se codifică variabilele pentru a fi introduse în foile de 
lucru din SPSS, cercetătorul alege o valoare distinctă pentru a indica o valoare 
lipsă a variabilei respective. Valoarea aleasă trebuie să fie în afara intervalului 
de valori posibile pentru date. De obicei, numere cum ar fi 9,99 şi 999 sunt 
folosite pentru valorile lipsă. Este posibil să aveţi mai mult de o valoare lipsă 
pentru oricare variabilă. De exemplu, cercetătorul va dori să distingă între 
circumstanţele în care participantul a refuzat să răspundă la chestionar şi 
cazurile când acesta a omis o întrebare din cu totul alt motiv. 

■ Valorile lipsă pot fi, de asemenea, utilizate pentru a „instrui” calculatorul să 
ignore cazurile cu o anumită valoare(valori) pentru o anumită variabilă. 

■ Trebuie să fim foarte atenţi la folosirea variabilelor lipsă în SPSS. Dacă o 
valoare nu a fost identificată ca valoare lipsă pentru o anumită variabilă, calcu¬ 
latorul va analiza ceea ce a intenţionat cercetătorul să fie variabilă lipsă ca pe o 
variabilă autentică. Acest lucru poate distorsiona serios analiza. 

85 Valorile lipsă pot fi folosite în două feluri principale. în ceea ce priveşte Hstwise 
cieletian - cazul este şters din analiză dacă este detectată vreo valoare lipsă 
pentru acei caz. Acest lucru poate micşora rapid numărul de participanţi la un 
studiu. Alternativa este de a şterge cazul din analizele care includ variabilele 
pentru care există valori lipsă. 

m Este mai bine să specificaţi valorile lipsă drept o valoare decât să nu introduceţi 
nimic pentru o intrare. Aceasta datorită faptului că unele greşeli de introducere 
în scris a datelor sunt uşor de confundat cu lipsa reală a valorilor. 

Când colectaţi datele, informaţiile pentru unele dintre cazuri ale unora dintre variabile 
ar putea lipsi. Luaţi, de exemplu, datele din tabelul 15.1, care consistă din notele de la 
muzică şi matematică, împreună cu codul pentru gen şi vârsta exprimată în ani. Nu există 
nici o informaţie lipsă pentru nici unul dintre cele 10 cazuri. Dar presupuneţi că primele 
două cazuri au lipsit la muzică, deci nu avem nici o valoare pentru ele. Ar fi păcat să nu 
folosim nici o dată de la aceste două cazuri, pentru că avem informaţii pentru celelalte 
trei variabile: matematică, gen şi vârstă. în consecinţă vom introduce d pentru 
aceste variabile. 



Tabelul 15.1 Notele la muzică şi matematică pentru 10 copii 
alături de categoria genului şi de cea a vârstei 
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Deşi am putea lăsa celula pentru valoarea variabilei „muzică” goală pentru cele două 
cazuri, ceea ce se realizează de obicei este codarea datelor lipsă cu un număr care nu 
corespunde nici unei valori posibile a variabilei. Presupunem că valoarea pentru muzică 
poate varia de la 0 la 10. Putem folosi orice număr, care nu este cuprins în intervalul 
0-10, pentru a semnala o valoare lipsă pentru testul la muzică. Vom utiliza numărul 11 ca 
fiind codul pentru valoare lipsă în coloana „muzică”, deci valorile de pe primele două 
rânduri ale primei coloane sunt 11. Presupunem că vârsta pentru cel de-al treilea caz 
lipseşte. Vom folosi cifra 0 ca fiind codul pentru vârsta lipsă. în continuare este nevoie 
să-i „explicăm” SPSS-ului cum am codat valorile lipsă. Dacă nu facem acest lucru, 
atunci SPSS-ul va interpreta aceste coduri ca valori reale. 

Valorile lipsă pot fi folosite de asemenea pentru a determina calculatorul să ignore 
anumite valori ale unei variabile, pe care dorim să le excludem din analiză. Aşadar, de 
exemplu, puteţi folosi valorile lipsă în ceea ce priveşte chi-square pentru a ignora 
anumite categorii. Lăsarea unui spaţiu gol într-o celulă în foaia de lucru a editorului de 
date va rezulta într-o oprire completă (.), fiind introdus în celulă dacă face parte dintr-o 
matrice activă de înregistrări. La nivelul output-ului acestea sunt identificate ca valori 
lipsă, dar ele ar fi mai bine privite ca valori omise. Am recomanda să nu folosiţi celulele 
goale ca o metodă de identificare a valorilor lipsă din moment ce această metodă nu face 
distincţie între valorile lipsă şi erorile de la tastatură. In mod normal numerele mari, cum 
ar fi 99 sau 999, reprezintă cea mai bună cale de a identifica valorile lipsă. 
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15.1. Definirea valorilor lipsă 


Pasul 1 

Selectaţi fişierul de la capitolul 
10 dacă l-aţi salvat. Dacă nu, 
introduceţi datele. 

Modificaţi cele două valori ale 
variabilei „Music" pentru cazurile 
1 şi 2 în „11". 

Modificaţi pentru cazul 3 variabila 
„Age" în 0. 



Pasul 2 

în „Variable View” din „Data 
Editor" selectaţi marginea din 
dreapta a celulei „Music" din 
Coloana „Missing". Va apărea 
un pătrat gri cu trei puncte. 

Selectaţi „Discrete missing 
values" şi Introduceţi valoarea 
„11” în căsuţa de mai jos. 

Apăsaţi „OK". Valoarea „11" 
apare în celula din coloana 
„Missing” corespunzătoare 
rândului „Music". 

Repetaţi această procedură 
pentru „Age", în loc de 
valoarea „11" introduceţi „0". 
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15.2. Opţiunile pairwise şi listwise 

Unele dintre opţiunile disponibile când aveţi valori lipsă sunt ilustrate cu procedura 
„corelare”, deşi opţiuni similare sunt disponibile împreună cu alte proceduri statistice. 


Pasul 1 

Selectaţi „Analyze”, 
„Correlate" şi „Bivariate...”. 


ml 



wmwm 


Nona 


None 

None 

[Nona 

[Nona 

o m 


VALORILE LIPSĂ 



Pasul 2 


Selectaţi „Music", „Ma 
şi „Age”, apoi apăsaţi 
pentru a introduce ac< 
variabile în lista de va 


Selectaţi „Options...". 


Pasul 3 


Observaţi că opţiunea 
predeflnltă „Missing Values" N 
este pairwise. 

Output-ul pentru pairwise este 
prezentat mai jos, primul. 


Dacă doriţi ştergerea listwise 
selectaţi „Exclude cases 
listwise" şi „Continue". 
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15.3. Eşantion din output pentru ştergerea pairwise 


8 cases 7 cases 



Correlation is significant at the 0.01 level (2-taîled). 


® Ştergerea pairwise presupune că o corelaţie va fi calculată pentru toate cazurile care 
nu au valori lipsă, pentru orice pereche de variabile. Din moment de sunt două valori 
lipsă pentru testul la muzică şi nici o valoare lipsă pentru testul de matematică şi gen, 
numărul de cazuri pe care vor fi bazate aceste corelaţii este 8. Pentru o valoare a 
variabilei „vârstă” lipseşte pentru un alt caz, numărul de cazuri pe care vor fi bazate 
corelaţiile dintre muzică şi gen este 7. Deoarece nu este nici o valoare lipsă pentru 
testele de matematică şi gen, numărul de cazuri pe care vor fi bazate aceste corelaţii 
este 10. în cele din urmă numărul de cazuri pe care vor fi bazate corelaţiile dintre 
rezultatele la matematică şi vârstă este 9, pentru că există o valoare lipsă pentru 
vârstă şi nici una pentru matematică. 

® Observaţi că numărul de cazuri variază pentru ştergerea pairwise a valorilor lipsă. 


15.4. Eşantion din output pentru ştergerea listwise 

® La ştergerea listwise corelaţiile sunt calculate pentru toate cazurile care nu au valori 
lipsă a variabilelor care au fost selectate pentru această procedură. în acest exemplu, 
numărul de cazuri care nu au valori lipsă pentru nici una dintre cele patru variabile 
este 7, ceea ce reprezintă rezultatul acestei proceduri, 
ii Observaţi că numărul de cazuri nu variază peru? --, ştergerea totală listwise a valorilor 
lipsă. 


VALORILE LiFSA 


13i 



Sex Pearson Correlation 
Sig. (2-tailed) 


Age, Pearson Correlation 
Sig. (2-tailed) 


**. Correlation is significant at the 0.01 level (2-tailed). 
a. Listwise N=7 


Toate cazurile sunt în număr de 7. 


15.5. Interpretarea output-ului 


Nu este mai nimic la output care să nu fi fost discutat In alte capitole. Sigurul lucru care 
merită reţinut este acela că statistica se bazează pe un număr redus de cazuri. 


15.6. Raportarea output-ului 

Amlntiţi-vă să raportaţi mărimile veritabile ale eşantionului (sau gradele de libertate) 
folosite pentru raportarea fiecărei analize statistice în loc de numărul de cazuri per total. 



























Recodificarea valorilor 


Rezumat 

n Din când în când, cercetătorii trebuie să modifice modul în care se înregistrează 
pe computer anumite valori ale unei variabile; uneori, trebuie combinate mai 
multe valori diferite într-una singură. * 

m Procedura de recodificare a valorilor oferă o flexibilitate considerabilă prin 
permiterea efectuării unor modificări rapide şi simple ale codificării numerice a 
oricărei valori. 

a Deoarece aplicaţia SPSS poate recodifica valori în mod rapid şi cu uşurinţă, este 
bine să introduceţi cât mai mulţi itemi cu date în forma lor originală. Acest lucru 
îi oferă cercetătorului o mare libertate de recodificare a datelor. Dacă acestea 
din urmă au fost înregistrate de către cercetător înainte de introducerea lor în 
foaia de lucru, nu se mai poate încerca o codificare alternativă a datelor ori¬ 
ginale. De exemplu, dacă toate scorurile sunt introduse pentru măsurarea 
extroversiunii fiecărui participant, SPSS se poate folosi pentru recodificarea 
datelor introduse (cum ar fi inversarea scorului unui item) sau pentru calcularea 
unui total pe baza tuturor itemîior de extroversiune sau a unei părţi dintre aceştia. 
Dacă cercetătorul calculează manual o valoare a extroversiunii înainte de a o 
introduce în SPSS, nu mai este posibilă refacerea scorului chestionarului într-o 
manieră diferită, fără să adăugăm şi scorurile originare, 
n De obicei, este cel mai bine să menţinem intacte datele originare. Aşadar, trebuie 
să vă asiguraţi întotdeauna că aţi creat o variabilă complet nouă (o coloană 
nouă) pentru variabila înregistrată. Nu modificaţi variabilele decât în cazul în 
care sunteţi absolut siguri că doriţi să modificaţi permanent datele originare. 

Uneori, este necesar să recodificăm valorile unei anumite variabile din datele noastre. 
Pot exista numeroase motive pentru acest lucru, printre care şi următoarele: 

W Să grupăm câteva categorii ale unei variabile nominale care, altfel, ar avea foarte puţine ca¬ 
zuri. Această metodă este folosită în mod obişnuit în metode statistice de tipul chi-square. 
ffl Să grupăm variabilele numerice în intervale de scoruri, 
a Să recodificăm itemii care trebuie inversaţi (vezi capitolul 17). 

Poate dorim să ne clasificăm eşantionul în două sau mai multe grupuri în funcţie de 
o anumită variabilă, cum ar fi vârsta sau inteligenţa. Vom ilustra recodificarea cazurilor 
folosind datele din tabelul 16.1 care conţine scorurile abilităţilor muzicale şi matematice 
obţinute de către un număr de 10 copii, însoţite de codul pentru gen şi vârsta în ani. 
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iăbelul 16.1. Scorurile abilităţilor muzicale şi matematice obţinute 
de cm re un număr de 10 copii, însoţite de codul pentru gen şi vârsta în ani 
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Scorurile abilităţilor muzicale şi matematice sunt aceleaşi pe care le-am prezentat 
anterior in tabelul 7.1. Să presupunem că dorim să procesăm corelaţia dintre valorile 
abilităţilor muzicale, pe de o parte, şi celor matematice, pe de alta, în cazul copiilor mici 
şi a celor mai mari. Pentru a face acest lucru trebuie să hotărâm mai întâi câte grupe de 
vârstă dorim. Din moment ce avem la dispoziţie doar 10 copii, ne vom mulţumi cu două 
grupuri. Apoi, vom decide care este punctul de separaţie a vârstei dintre cele două 
grupuri. Din moment ce dorim ea cele două grupuri să fie de mărime considerabilă, vom 
selecta valoarea 10 drept punct de separaţie, aceasta însemnând că în prima grupă vor fi 
incluşi cei care au mai puţin de 10 ani, iar în cea de-a doua cei care au zece sau mai mulţi 
ani. Acum, vom folosi aplicaţia SPSS pentru a recodifica vârsta în acest fel. 


16.1. Recodificarea valorilor 


Pasul 1 

Selectaţi fişierul din capitolul 10 
dacă i-aţi salvat. 

Dacă nu, introduceţi datele. 









































INTRODUCERE IN SPSS PENTRU PSIHOLOGIE 


134 

Pasui 2 


Selectaţi „Transform", 
„Recode" şi „into 
Different Variables...". 


Pasul 4 

Selectaţi „Range: Lowest 
through" şi scrieţi „9" în caseta 
de alături. 

Selectaţi „Value:" din meniul 
„New Vaiue" şi scrieţi „1" în 
caseta de alături. 

Selectaţi „Add" şi introduceţi 
„lowest through 9 -1" în 
caseta „Old -♦New". 


Pasul 3 


Selectaţi „Age” şi apăsaţi 
butonul < pentru a introduce 
„Age" în caseta „Numeric 
Variable -*Output variable:" 


Introduceţi numele noii 
variabile (de 
„AgeRec") în 


Selectaţi „Change" pentru a 
adăuga acest nume nou în 
caseta „Numeric Variable -* 
Output Variable:". 


Selectaţi „Old and New 
Values...". 


RECODIFICAREA VALORILOR 


135 


Pasui 5 



Selectaţi „Range: through 
highest" şi scrieţi „10" în 
caseta de lângă el. 

Selectaţi „Value:" din meniul 
„New Value" şi scrieţi „2” în 
caseta de alături. 

Selectaţi „Add" şi introduceţi 
„10 through Highest -+2" 
caseta „Old-* New". 

Selectaţi „Continue". 

Apăsaţi „OK" în ecranul 
anterior, care va reapărea. 


Pasul 6 


Noua variabilă şi valorile 
sale sunt afişate în meniul 
„Data View". Asiguraţi-vă că 
acestea sunt valorile de care 
aveţi nevoie. 



Dacă deţineţi un set complex de date, puteţi "uita cu uşurinţă ce modificări aţi făcut 
asupra datelor dumneavoastră. înregistrarea poate modifica radical outuput-uî unei analize 
efectuate cu ajutorul computerului. Trebuie să verificaţi cu atenţie implicaţiile oricăror 
recodificări înainte de a Ie raporta. 

16.2. Recodificarea valorilor lipsă 

Observaţi că atunci când există valori lipsă (ca în cazul vârstei în secţiunea 15.1, 
pasul 1), este nevoie să codificaţi aceste valori prin selectarea comenzilor „System-or 
user-missing” în secţiunea „Old Value” a subcasetei de dialog „Recode into Different 
Variables: Old and New Values” şi selectarea comenzii „System-missing” din secţiunea 
„New Value”. 

Verificaţi întotdeauna dacă recodificarea a funcţionat aşa cum trebuia comparând în 
editorul de date valoarea veche şi cu cea nouă, pentru fiecare nouă valoare, luând unul 
sau mai multe cazuri. 
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16.3. Salvarea procedurii de recodificare ca fişier de sintaxă 

Trebuie să reţineţi modul In care au fost create noile variabile. Cel mai simplu este să | 
scrieţi. O altă metodă ar fi să salvaţi sub formă de comandă de sintaxă ceea ce aţi lucrat, j 
folosind opţiunea „Paste” din caseta principală a procedurii. Output-ul pentru această | 
procedură este ilustrat mai jos. 


Apăsaţi butonul ► pentru a 
rula comenzile de sintaxă. 

O comandă de sintaxă. — 





RECODE 

Aga 

(Lcwest thru 9=1) {10 thru Highest=2) INTO AgeRec . 

Execute. 


Salvaţi această comandă sub formă de fişier. Dacă doriţi, puteţi folosi fişierul pentru 
efectuarea acestei proceduri pe alt set de date. înainte de elaborarea sistemului de 
operare Windows, comenzile din SPSS erau efectuate prin acest tip de comenzi de sintaxă. 

Pentru probarea acestei proceduri, selectaţi coloana „Data View" care conţine vârsta 
recodificată şi ştergeţi-o. Selectaţi fereastra Syntax, selectaţi întreaga comandă existentă 
acolo şi rulaţi-o cu butonul indicat mai sus din bara de instrumente. 




Calculul variabilelor noi 


Rezumat 

* Calculul variabilelor noi vă permite să adunaţi, să scădeţi etc. valorile câtorva 
variabile pentru a obţine o nouă variabilă. De exemplu, este posibil să doriţi Sâ 
adunaţi câteva întrebări dintr-un chestionar, pentru a obţine un indic© generai al 
ceea ce măsoară chestionarul. 

■ Unul dintre puţinele dezavantaje ale SPSS-ului pentru Windows este faptul că 
nu se păstrează nici o înregistrare a modului în care a fost calculată variabila 
nouă de la bun început. Puteţi fie să vă păstraţi înregistrări scrise detaliate aie 
formulelor folosite pentru procesarea noii variabile, fie, dacă este suficient de 
simplu, să folosiţi etichetarea variabilelor pentru a descrie metoda. 

■ Atunci când procesaţi o nouă variabilă, în general este bine să fiţi precauţi şi să 
verificaţi cazurile manual de câteva ori. Este uşor să introduceţi din greşeală o 
formulă incorectă care va produce mai apoi o nouă variabilă care să nu fie cea 
pe care credeaţi că o creaţi. 

Atunci când analizaţi datele, este posibil să doriţi să formaţi o nouă variabilă pe baza 
uneia sau mai multor variabile vechi. De exemplu, atunci când măsuraţi variabilele 
psihologice, se folosesc adeseori mai multe întrebări pentru a măsura mai mult sau mai 
puţin acelaşi lucru. De exemplu, următoarele patru afirmaţii pot fi folosite pentru 
evaluarea satisfacţiei faţă de viaţă: 

a. în general mă bucur de viaţă. 

b. Unele zile parcă mă doboară. 

c. Adeseori, viaţa mi se pare destul de anostă. 

d. Viitorul pare promiţător. 

Participanţilor li se cere să afirme în ce măsură sunt de acord cu fiecare dintre aceste 
afirmaţii, pe următoarea scală de la 1 la 4: 

1: Sunt întru totul de acord; 2: Sunt de acord; 

3 : Nu sunt de acord; 4: îmi exprim dezacordul vehement. 



Putem folosi aceşti patru itemi pentru a determina nivelul de satisfacţie în viaţă a 
oamenilor, prin adunarea răspunsurilor date tuturor celor patru afirmaţii. 

Observaţi o problemă care apare în mod frecvent atunci când lucrăm pe baza chestio¬ 
narelor : dacă răspundeţi „Sunt întru totul de acord” la primul şi al patrulea item, indicaţi 
faptul că vă bucuraţi de viaţă, pe când dacă răspundeţi „îmi exprim dezacordul vehement” 
la al doilea şi al patrulea item, se subînţelege că nu sunteţi mulţumiţi de viaţa dumneavoastră. 






Tabelul 17.1. Valorile satisfacţiei faţă de viaţă la trei interlocutori 



Avem nevoie de scoruri mai mari care să indice o satisfacţie mai mare. în consecinţă, 
vom inversa evaluarea pentru primul şi al patrulea item, după cum urmează: 

1: îmi exprim dezacordul vehement; 2: Nu sunt de acord; 

3 : Sunt de acord; 4: Sunt intru totul de acord. 

Putem folosi procedura de recodificare descrisă în capitolul 16 pentru a recodifica 
valorile primului şi celui de-a! patrulea item. 

Datele din tabelul 17.1 prezintă atât răspunsurile date de către trei indivizi la cele 
patru afirmaţii, cât şi modul !n care trebuie reeodificate răspunsurile la primul şi cel 
de-al patrulea item. Vom folosi aceste date pentru a ilustra procedura SPSS de adunare 
a răspunsurilor la cele patru afirmaţii, pentru a crea un indice al satisfacţiei în viaţă. 

17.1. Procesarea unei variabile noi 


Pasul 1 


Introduceţi datele (recodificate), i 

după ce aţi denumit variabilele în 

rnmmm 

2 

4 

3 

felul în care este indicat şi după 

m 2 

3 

2 

1 

ce aţi îndepărtat cele două 
zecimale. i 

i 4 

3 

3 

2 

1 


Pasul 2 

Selectaţi „Transform" şi 
„Compute”. 



17.2. Salvarea procedurii de procesare ca fişier de sintaxă 


Pentru a salva această 
procedură sub formă de 
fişier de sintaxă, selectaţi 
„Paste" în caseta 
principală. Această 
comandă de sintaxă va 
apărea în fereastra 
Syntax. (Vezi pasul 4.) 








Rezumat 


» Se poate ca uneori să doriţi să ştiţi dacă mediile a două seturi diferite de scoruri 
sunt semnificativ diferite una de alta, dar intuiţi că nu este îndeplinită condiţia ca 
scorurile fiecărei variabile să fie cât de cât normal distribuite (în formă de 
clopot). în aceste condiţii se pot folosi testele nonparametrice. 
m Testele nonparametrice sunt teste care fac mai puţine presupuneri referitoare la 
caracteristicile populaţiei de la care provin datele. Această trăsătură nu este 
specifică testelor parametrice (cum ar fi Testul t ) care fac mai multe presupuneri 
despre natura populaţiei de la care provin datele. Ipoteza normaiitâţii (distribuţiile 
de frecvenţă în formă de clopot) reprezintă un exemplu de ipoteză implicită 
metodelor statistice parametrice. 

m Strict vorbind, metodele statistice nonparametrice nu testează diferenţele dintre 
medii. Acest lucru nu este posibil din moment ce acestea folosesc scoruri 
transformate în ranguri. De obicei, prin aceste metode se verifică dacă 
rangurile dintr-un grup sunt, de obicei, mai mari sau mai mici decât rangurile din 
celălalt grup. 

* Am inclus aici Testul semnului şi Testul Wilcoxon pentru date corelate (eşantioane 
perechi). Cu alte cuvinte, aceste teste sunt echivalentele nonparametrice ale 
Testului t pentru eşantioane perechi. Testul Wilcoxon ar trebui să fie preferat 
Testului semnului atunci când se compară date numerice. 

■ Testul i/Mann-Whitney se foloseşte pentru date nerelaţionate. Aşadar, acesta 
este echivalentul nonparametric al Testului / pentru eşantioane independente. 

Procesarea a două teste nonparametrice pentru scoruri relaţionale este exemplificată 
folosind datele din tabelul 18.1, care a fost folosit şi în capitolul 12 şi care indică 
numărul de contacte vizuale stabilite de aceiaşi copii cu mamele lor la vârstele de 6 şi 9 
luni. Observaţi că Testul semnului (secţiunea 18.1) şi Testul Wilcoxon al rangurilor 
pereche (secţiunea 18.4) determină nivele de semnificaţie diferite. în ceea ce priveşte 
detectarea diferenţelor, Testul semnului pare a fi oarecum mai puţin puternic decât restul 
Wilcoxon al rangurilor pereche. 





Mg 
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Pasul 2 

Selectaţi „Analyze”, 
„Nonparametric Tests" 
şi „2 Reiated Samples, 


TESTELE RANGURILOR 


18.1. Scoruri relaţionale: Testul semnului 


Tabelul 18.1. Numărul de segmente de contact vizual 
care durează un minut, pe diferite vârste 


Pasul 1 


Selectaţi fişierul cu date 
dacă l-aţi salvat. Dacă 
nu, introduceţi datele. 















Pasul 3 


Selectaţi „Six_mths", 
„Ninejnths" şi apăsaţi 
butonul ■* pentru a introduce 
aceste două variabile în 
caseta .Test Pair(s) List:". 

Deselectaţi „Wilcoxon". " 

Selectaţi „Sign". --— 

Apăsaţi „OK". - 


r !ţ) 
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18.2. Interpretarea output-ului pentru Testul semnului 


Putem ignora primul 
dintre cele două tabele 
de output. Acesta indică 
numărul de diferenţe 
negative (2). pozitive (8) 
şi inexistente (0) în ceea 
ce priveşte zâmbetul la 
cele două vârste. 


Froquoncies 


N 

Ninejnth - Six _mths Negative Differences* 

2 

Poslttve Differences 0 

6 

Ties c 

0 

Total 

8 


a. Nine_mth < Sixjnths 

b. Ninejnth > Sixjnths 

c. Nine_mth = Sixjnths 


A! doilea tabel indică nivelul de semnificaţie a! 
acestui test. Probabilitatea two-tailed este de 0.289 
sau de 29%, ceea ce este în mod evident 
nesemnificativ la nivelul de 5%. Distribuţia binomlală 
se referă la tehnica statistică prin care pot fl găsite 
probabilităţile în cazul eşantioanelor formate lin 
doar două valori posibile diferite, aşa cum se 
întâmplă în cazul Testului semnului (dat fiind faptul 
că vom ignora legăturile dintre valori). 


Test Statlstlcs b 



Ninejnth - 
Six_mths 

Exact Sig. (2-tailed) 

.289* 


a. Am folosit distribuţia blnomialâ. 

b. Testul semnului. 


18.3. Raportarea output-ului pentru Testul semnului 

Putem raporta aceste rezultate după cum urmează: „Nu a existat o schimbare semnifi¬ 
cativă la nivelul numărului de contacte vizuale de la 6 la 9 luni (Testul semnului: N — 8, 
p = 0,289)”. 


18.4. Scoruri relaţionate: Testul Wilcoxon 

Testul Wilcoxon reprezintă opţiunea predefinită în caseta de dialog a testelor cu două 
eşantioane perechi. Dacă aţi deselectat-o anterior, va trebui să o selectaţi din nou. 
Apăsaţi „OK” pentru a obţine output-ul Testului Wilcoxon. 


18.5. Interpretarea output-ului pentru Testul Wilcoxon 


Putem ignora primul 
dintre cele două tabele 
de output. Acesta indică 
numărul de diferenţe 
negative (2), pozitive (6) 
şi inexistente (0) în ceea 
ce priveşte dateie 
ordonate după cele 
două vârste, şi media şi 
suma datelor catalogate 
negative şi pozitive. 
Valorile pentru 
„Ninejnths" sunt mai 
mari decât cete pentru 

Qiy mthc" 



N 

Mean Rank 

Sum of Ranks 

Ninejnth - Sixjnths Negative Ranks 

2“ 

3.00 

6.00 

Positive Ranks 

6 B 

5.00 

30.00 

Tles 

0° 



Total 

8 




a. Ninejnth < Sixjnths 

b. Ninejnth > Sixjnths 

c. Ninejnth = Sixjnths 


Al doilea tabel indică nivelul de semnificaţie al 
acestui test. în loc să folosească tabelul valorilor 
critice, computerul utilizează o formulă care 
stabileşte o conexiune cu distribuţia z. Scorul z 
este de -1,706, care are o probabilitate 
two-tailed de 0,088. Aceasta înseamnă că 
diferenţa dintre cele două variabile nu este 
semnificativă statistic la un nivel de 5%. 


Test Statistice 5 



Ninejnth - 
Sixjnths 

Z 

Asymp. Sig. (2-tailed) 

-1.706* 

.088 


a. Pe baza rangurilor negative. 

b. Testul Wilcoxon al rangurilor însemnate 


18.6. Raportarea output-ului pentru Testul Wilcoxon 

Putem raporta aceste rezultate după cum urmează: „Nu s-a găsit nici o diferenţă 
semnificativă între numărul de contacte vizuale stabilite de bebeluşii între 6 şi 9 luni 
(Wilcoxon: N ~ 8, z - 1,71, two-tailed p ~ 0,088)”. 


18.7. Scoruri nerelaţionate: Testul U Mann-Whitney 

Vom ilustra procesarea unui test nonparametric pentru scoruri necorelate, folosind datele 
din tabelul 18.2, care indică scoruri ale emotivităţii obţinute de 12 copii proveniţi din 
familii cu doi părinţi şi de 10 copii proveniţi din familii cu un singur părinte. 
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Tabelul 18.2. Nivelul emotivităţii în familiile 
cu doi părinţi şi în cele cu unul singur 


Pasul 1 

Selectaţi fişierul cu date 
dacă l-aţi salvat. Dacă 
nu, introduceţi datele. 


Pasul 2 

Selectaţi „Analyze", 
„Nonparamteric Tests" şi 
Independent Samples... 1 '. 


TESTELE RANGURILOR 




Pasul 3 


Selectaţi „Family” şi apăsaţi 
butonul « pentru a intro¬ 
duce „Family" în caseta 
„Grouping Variabie;". 


Selectaţi „Define Groups..." 


Pasul 4 

Scrieţi „1" (pentru un singur 
părinte) în caseta de 
„Group 1:". 

Scrieţi „2” (pentru doi 
părinţi) în caseta de lângă 
„Group 2:". 

Selectaţi „Continue”. 

Apăsaţi „OK" în ecranul 
anterior, care va reapărea. 


Selectaţi ..imotlon" şi 
apăsaţi bu:cnul ► pentru a 
introduce parametrul 
„Emotion” în caseta „Test 
Variabie List:". 


18.8. Interpretarea output-ului pentru Testul U Mann-Whitney 


Putem ignora primul dintre cele 
două tabele de output. Acesta 
indică faptul că rangul mediu dat 
parametrului „Emotion" pentru 
primul grup (adică valoarea = 1) 
este de 7,85, iar rangul mediu - 
pentru al doilea grup (adică 
valoare = 2) este de 14,54. 
Aceasta înseamnă că valorile din 
grupul 2 au tendinţa să fie mai 
mari decât cele din grupul 1. 


Family 

N 

Mean Rank 

Sum of Ranks 

Emotion 1 

10 

^ 7UJ5 V 

78.50 

Total 

22 



























Teet Statistica 1 


Al doilea tabel indică statistica de bază 
Mann-Whitney, valoarea U fiind de 
23,500, ceea ce este semnificativ din 
punct de vedere statistic la nivel de 0,014. 

în plus, computerul a listat un scor zde 
-2,414, care este semnificativă la nivel de 
0,016. Aceasta este valoarea Testului 
Mann-Whitney atunci când se aplică o 
corecţie pentru ranguri înrudite. După 
cum se poate vedea, aceasta a modificat 
nivelul de semnificaţie doar marginal, de 
ia 0,014 1a 0,016. 



a. Necorectată pentru ranguri înrudite. 

b. Variabila de grupare: Familia. 


18.9. Raportarea output-ului pentru Testul U Mann-Whitney 

Putem raporta rezultatele acestei analize după cum urmează: „Testul U Mann-Whitney 
a concluzionat că scorurile emotivităţii la copiii din familiile cu doi părinţi sunt semni¬ 
ficativ mai mari decât la cei din familiile cu un singur părinte (U = 23,5, = 10, 

N 2 = 12, p two-tailed p ~ 0,016)”. 


Testul raportului de varianţă 
Folosirea Raportului F pentru compararea 
a două varianţe _======= 


Rezumat 

* Testul raportului de varianţă (Testui F) indică existenţa unei diferenţe pe care o 
pot manifesta două seturi de scoruri necorelate ia nivelul variabiiităţii scorurilor 
în jurul mediei (adică dacă varianţele sunt sau nu semnificative din punct de 
vedere statistic). 

■ Acest lucru este în mod evident diferit de calcularea măsurii în care două medii 
sunt diferite şi trebuie să ţineţi minte că varianţele pot fi semnificativ diferite, chiar 
dacă mediile celor două grupuri de scoruri sunt aceleaşi. în consecinţă, examinarea 
varianţelor variabilelor poate fi la fel de importantă cum este compararea mediilor. 

a Din cauza faptului că există puţine întrebări provenite din cercetare care să fie 
formulate din punctul de vedere al diferenţelor de varianţă, cercetătorii au tendinţa 
să scape din vedere efectele asupra varianţelor şi să se concentreze asupra dife¬ 
renţelor dintre mediile eşantioanelor. Această tendinţă trebuie evitată cât mai mult. 

■ Testul Feste, probabil, mai des asociat cu Testul tşi cu analiza de varianţă. 

Pentru a procesa raportul de varianţă - sau Raportul F - vom împărţi varianţa 
estimată mai mare la varianţa estimată mai mică. Varianţa estimată se obţine prin 
procedura „Descriptives” introdusă pentru prima dată în capitolul 5. Procesarea raportului 
de varianţă este ilustrată folosind datele din tabelul 19.1 (ISP, tabelul 19.2), care rapor¬ 
tează scorurile stabilităţii emoţionale a pacienţilor cărora li s-au aplicat şocuri electrice 

Tabelul 19.1. Scorurile stabilităţii emoţionale dintr-un studiu asupra 
efectelor terapiei cu şocuri electrice asupra emisferelor cerebrale 









148 


INTRODUCERE ÎN SPSS PENTRU PSIHOLOGIE 


fie prin emisfera dreaptă, fie prin cea stângă a creierului. In aces: capitol, metoda necesită 
puţin calcul manual. Totuşi, vă va oferi şi experienţă suplimenară folosirea SPSS-uIui. 

O modalitatea alternativă de atingere a aceluiaşi obiectiv este urmărirea procedurilor 
Testului t din capitolul 13. Poate vă amintiţi că Testul Levene al Raportului F face parte 
din output-ul pentru acel Test t. Deşi Testul Levene este puţin diferit, acesta reprezintă 
o alternativă convenţională utilă a Testului F. 

19.1. Varianţa estimată 


Pasul 1 

Introduceţi datele. Codificaţi 
emisfera stângă cu „T şi pe 
cea dreaptă cu „2". Etichetaţi 
aceste două valori. Numiţi 
această variabilă prescurtat 
„Spheres”. 



Pasul 2 


Selectaţi „Analyze”, 
„Compare Means" şi 
„Means...". 



J Ownpow.'S«i»ac» ; 

'■ v^Tatte--- vil 


: One-Swţelp T.îţwt.yijv : -O 

■p^sa^t.îşu,,, ... 

rOoe-Woy fltKNfa&t' -[V 


GeneraU*»» Matei; 

"'“Conetoe- 

■ ■ . ■ - • ■ * O x 1 

Regrftsaoo 


TESTUL SUPORTULUI DE VARIANŢĂ 















J.DU 


un i.s.0ijucc.isji iîs it'ii i'iiîNSRu tamui-uCilt 


19.2. Calcularea raportului de varianţă din output 

® împărţiţi varianţa estimativă mai mare din output la varianţa estimativă mai mică. 
Varianţa estimativă mai mare este de 191,476 (pentru „Dreapta”), şi, atunci când este 
împărţită la varianţa estimată de 19,810 (pentru „Stânga”) dă naştere unei varianţe 
sau unui Raport F de 9,6656. Această medie este de 9,66 dacă o rotunjim la un număr 
cu numai două zecimale. 

® Căutaţi semnificaţia statistică a acestui raport într-un tabel de valori critice ale 
Rapoartelor F, în care gradul de libertate al raportului dintre numărător (191,48) şi 
numitor (19,81) este 6 în ambele cazuri. 

® Valoarea critică de 0,05 a Raportului Fcu 6 grade de libertate la nivelul numărătorului 
şi numitorului este 4,28. 

m Raportul F pe care l-am obţinut este de 9,66, care este mai mare decât valoarea critică 
0,05 de 4,28 (vezi ISP, tabelul de semnificaţie 19.1, unde cea mai apropiată valoare 
critică este 4,4, având 5 grade de libertate ia numărător). 


19.3. Raportarea valorii raportului de varianţă 

Putem raporta aceste constatări după cum urmează: „Varianţa scorurilor emotivităţii la 
pacienţi cu afecţiuni în zona emisferei dreapte a fost semnificativ mai mare decât cea a 
pacienţilor cu afecţiuni în zona emisferei stângi (F 66 - 9,66. p < 0,05)”. 




Analiza de varianţă (ANOVA) 
Introducere în metoda one-way ANOVA cu 
scoruri nerelaţionate sau necorelate 



s Analiza de varianţă cu scoruri relaţionate/necorelate indică măsura în care 
câteva (două sau mai multe grupuri) au medii foarte diferite. Această analiză 
presupune că fiecare dintre grupurile de scoruri provine de la indivizi diferiţi. Nu 
este o condiţie esenţială să avem scoruri egale în fiecare set. 

* Grupurile diferite aparţin variabilei independente. Valorile numerice corespund 
variabilei dependente. 

B Prac ţ ic > analiza de varianţă calculează variaţia dintr© scoruri şi pe cea dintre 
mediile pe eşantioane. Ambele variaţii pot fi folosite pentru estimarea variaţiei la 
nivelul populaţiei. Dacă două valori estimative sunt fogrte diferite, înseamnă că 
variaţia datorată variabilei independente este mai mare decât ne-am putea 
aştepta pe baza variaţiei dintre scoruri. Dacă această disparitate este suficient 
de mare, diferenţa de la nivelul variabilităţii este semnificativă din punct de 
vedere statistic. Acest lucru înseamnă că variabila independentă are efect 
asupra scorurilor. 

a Analiza de varianţă poate fi dificil de interpretat atunci când se folosesc două 
sau mai mult de două grupuri. Analiza generală a varianţei trebuie să fie 
semnificativă din punct de vedere statistic, dar e greu de ştiut care dintre cele 
trei sau mai multe grupuri este semnificativ diferit de celelalte, 
a Soluţia este descompunerea analizei în câteva comparaţii separate, pentru a 
evalua care dintre seturile de scoruri sunt semnificativ diferite de celelalte seturi 
de scoruri. Aşadar, care dintre grupuri sunt semnificativ diferite de celelalte. 

B in mod ideal, trebuie să se facă o ajustare a numărului de comparaţii efectuate 
(vezi capitolul 23 despre comparaţiile multiple, pentru informaţii referitoare la 
metode mai bune decât cele descrise în aceste capitol pentru realizarea acestui 
lucru). Această ajustare este necesară, deoarece, cu cât sunt efectuate mai 
multe comparaţii statistice, cu atât este mai mare probabilitatea ca unele dintre 
comparaţii să fie semnificative din punct de vedere statistic. 

Procesarea analizei one-way de varianţă cu scoruri nerelaţionate este exemplificată 
folosind datele din tabelul 20.1 (ISP, tabelul 20.2), care indică rezultatele obţinute de 
către diferiţi participanţi în condiţii diferite. Este vorba despre un studiu asupra efectului 
unor diferite tratamente hormonale şi placebo asupra depresiei. Aşadar, medicamentul 
este variabila independentă, iar depresia - variabila dependentă. 
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Tabelul 20.1. Date pentru un studiu asupra 
efectelor hormonilor 





Pasul 2 



Selectaţi „Analyze” 
„Compare Means" şi 
„One-Way ANOVA.. 



ANALIZA DE VARIANŢĂ (ANOVA) 


153 



Qric-Way AND VA: Option? 




Pasul 3 

Selectaţi „Depression” şi 
apăsaţi butonul ► de lângă 
caseta „Dependent List:” 
pentru a introduce para¬ 
metrul în casetă. 

Selectaţi „Condition" şi 
apăsaţi butonul < de lângă 
caseta „Factor:” pentru a 
introduce parametrul acolo. 

Selectaţi „Options...”.- 


Depiostion 


Pasul 4 

Selectaţi metodele 
statistice „Descriptive^ 
şi „Homogeneity of ___ 
variance test". 

Selectaţi „Continue". __ 

Apăsaţi „OK" în ecranul 
anterior, care va 
reapărea. 


20.2. Interpretarea output-ului 


Descriptive» 







95% Confidence Interval for 
Mean 



__ A 

l'f 

Mean 

Std. DeviationN 

Std. Error 

Lower Bound 

Upper Bound 

Minimum 

Maximum 

Hormone 1 l 

3 

9,67 

2.082 

1.202 

4.50 

14.84 

8 

12 

Hormone 2 


3*67 


.882 

-.13 

7.46 

2 

5 

Placebo control 

3 

4T3CT 

-C~1.732 

1.000 

-.30 

8.30 

3 

6 

Total 

9 

5,78 

\ 3.308 

1.103 

3.23 

8.32 

2 

12 


Primul tabel oferă diferite statistici descriptive, cum ar fi 
numărul de cazuri, media şi abaterea standard în cele trei 
condiţii şi pe eşantionul total. 
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Test of Homogeneity of Variances 


Levene 

Statistic 

dft 

df2 

Slg. 

.293 

2 

6 



Al doilea tabel ne oferă rezultatele Testului 
Levene al similarităţii varianţelor. Din moment ce 
acest test nu este semnificativ (având o 
semnificaţie de 0,756), varîanţele sunt similare 
✓sau omogene. Dacă varianţele nu ar fi omogene, 
ar trebui să încercăm să transformăm scorurile şi 
să le facem să fie omogene. Altfel, pot apărea 
probleme la interpretarea analizei de varianţă. 


Depression 

Al treilea tabel indică 
rezultatele analizei de 
varianţă. Raportul Feste 
semnificativ la nivel de 
0,011, din moment ce este 
mai mic de 0,05. 


■ Raportul F se calculează prin împărţirea „sum of squares” (suma pătratelor abaterilor 
de la medie) dintre grupe este împărţită suma pătratelor de la media din interiorul 
grupelor („sum of squares on three groups"), ceea ce ne dă un Raport F de 10,586 
(34,111/3,222 = 10,5869). 

■ Aceasta înseamnă că există o diferenţă semnificativă între cele trei grupuri. Totuşi, nu 
implică neapărat faptul că toate mediile sunt semnificativ diferite una de alta. în 
acest caz, bănuim că mediile de 3,67 şi 4,00 nu sunt semnificativ diferite. 

* Mediile care diferă de celelalte pot fi determinate în continuare prin folosirea testelor 
prin comparaţii multiple, cum este Testul t pentru eşantioane independente. Pentru a face 
acest lucru, urmaţi procedura indicată pentru Testul t pentru eşantioane independente, 
aşa cum este descrisă în capitolul 13. Nu trebuie să reintroduceţi datele. Totuşi, puteţi 
realiza un Test t definind grupurile ca 1 şi 2, după care le puteţi redefîni ca 1 şi 3 şi, 
în cele din urmă, să le redefininţi ca 2 şi 3. în exemplu! nostru, grupul 1 este 
semnificativ diferit de grupurile 2 şi 3, care nu diferă semnificativ între ele. (Pentru 
mai multe detalii vezi ISP, capitolul 13.) 

* Din cauza faptului că efectuăm trei comparaţii, nivelul exact de semnificaţie pentru 
fiecare Test / trebuie multiplicat de 3 ori pentru a se obţine nivelul de semnificaţie 
Bonferroni. 


20.3. Raportarea output-ului 



Putem raporta rezultatele după cum urmează: „Per total, efectul tratamentului cu 
medicamente a fost semnificativ (F, 6 = 10,58, p - 0,011). Când s-a efectuat o ajustare 
Bonferroni a numărului de comparaţii, singura diferenţă semnificativă a fost aceea dintre 
mediile tratamentului hormonal 1 şi a tratamentului hormonal 2 (/ = 4,02, DF = 4, j 

two-tailed p < 0,05). Media tratamentului hormonal 1 (M = 9,67, SD = 7 08) a fost j 

semnificativ mai mare decât aceea pentru tratnmc.îOil hormonal 2 (M = 3,67,-- 1,53). ] 

Nu a existat nici o diferenţă semnificativă între media controlului placetc şi media >| 
oricăruia dintre tratamentele hormonale 1 şi 2” 



Analiza de varianţă pentru scoruri 
corelate sau măsurători repeta te 




Rezumat 


a Analiza de varianţă indică măsura în care câteva (două sau mai multe) seturi de 
scoruri au medii foarte diferite. Totuşi, această analiză presupune că un singur 
eşantion de indivizi a contribuit cu scoruri pentru fiecare dintre seturile diferite 
de valori şî se bazează pe coeficienţi de corelaţie presupuşi a fi mari între 
seturile de scoruri. 

a Dacă datele dumneavoastră nu îndeplinesc aceste condiţii, reveniţi la capitolul 
20 care se referă la analiza de varianţă pentru eşantioane independente, 
a Modificările scorurilor unei variabile în timp reprezintă un exemplu caracteristic 
al unui tip de studiu adecvat analizei de varianţă pentru eşantioane perechi, 
a Dacă este folosit corect, modelul poate fi extrem de eficient, pentru că sunt 
necesari mai puţini participanţi pentru efectuarea studiului. Motivul este acela 
că, odată ce participanţii sunt măsuraţi de mai multe ori, devine posibilă estimarea 
componentei diferenţelor individuale a variaţiei datelor. într-un studiu asupra 
memoriei, de exemplu, unii participanţi vor avea tendinţa să aibă rezultate bune 
indiferent de condiţii, iar ceilalţi vor avea tendinţa să obţină rezultate proaste. 
Aceste diferenţe individuale pot fi identificate şi ajustate în cadrul analizei. Ceea 
ce ar putea fi clasificat ca variaţie a erorii într-o analiză de varianţă cu eşantioane 
Independente este separat Tn două componente - componenta diferenţelor 
individuale (eroarea implicită subiecţilor) şi eroarea reziduală. Practic, acest 
lucru înseamnă că termenul „eroare” a fost redus din cauza îndepărtării com¬ 
ponentei diferenţelor individuale. Din moment ce termenul „eroare” este mai 
redus, putem obţine rezultate semnificative folosind un număr mai mic de 
participanţi decât în cazul unui mode! cu scoruri nerelaţionate. 

Procesarea analizei de varianţă cu scoruri unifactoriale corelate este exemplificată 
folosind datele din tabelul 21.1, care indică valorile obţinute de aceiaşi participanţi în trei 
condiţii diferite (ISP, tabelul 21.10). 
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21.1. Medota one-way ANOVA pentru scoruri relaţionate 


Pasul 1 

Introduceţi datele. Din 
moment ce datele sunt 
corelate, valorile pentru 
cele trei condiţii se 
regăsesc în cele trei 
coloane. 


Pasul 2 

Selectaţi „Analyze”, 
.General Linear Model” şi 
„Repeated Measures...". ■ 


Pasul 3 

Scrieţi „3" în caseta 
„Number of Levels:" 

Selectaţi „Add”. 

Selectaţi „Define". 



:ed MeasuresîOpUons 
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Pasul 4 

Selectaţi fiecare variabilă 
individual Sau pe toate trei 
odată şi apăsaţi butonul ► 
de lângă caseta 
„Within-Subjects 
Variables:" pentru a le 
introduce acolo. 

Selectaţi „Options...”. 


(AlpiirO! 


Ptoduc£<T2i 


Selectaţi .Descriptive 
statistics". 


Selectaţi „Continue' 

Apăsaţi „OK” în 
ecranul anterior, 
care va reapărea. 


IIOVERALl) 
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21.2. Interpretarea output-ului 

Output-ul redă şapte tabele. în această secţiune sunt prezentate doar cele mai importante 
dintre ele. 


Descriptiva Statistic» 



Mean 

Std. Deviation 

N 

Aspirin 

6.00- 

*— -Tzxr 

*— 

ProducfX 

8.00 

1.581-1 

Ir- 5 

Placebo 

4.00 

1.581 

5 


Al doilea tabel indică abaterile 
medie şi standard pentru cele 
trei grupuri. 


Mauchl/s Test of Sphericity 6 







Epsilon* 

Wlthin Sub]ects Effect 

MaueMy's W 

Approx. 

Chi-Square 

df 

^*§igN, 

Greenbouse- 

Geisser 

Huynh-Feldt 

Lower-bound 

faeton 

.862 

.444 

2 


.879 

1.000 

.500 


Testează ipoteza de nul conform căreia matricea de eroare a covarianţei pentru variabilele dependente 
transformate ortonormalizate este proporţională unei matrfpi de identitate. 

a. Poate fi folosit pentru ajustarea gradului de libertate în cazul testelor obişnuite de semnificaţie. Testele 
corectate sunt prezentate în tabelul „Tests of Within-Subjecţs Effects" ale efectelor implicite subiecţilor. 

b. Model: intercepţie. ‘ 

Model implicit subiecţilor: factorul 1. 

Cel de-a! patrulea tabel indică rezultatele obţinute în urma Testului 
Mauchly de sfericitate. Din moment ce acest test nu este 
semnificativ, sfericitatea este o condiţie asumată şi nu mai este 
nevoie să ajustăm nivelele de semnificaţie a analizei. Dacă aceasta 
este semnificativă, atunci trebuie folosit unul dintre testele 
alternative din următoarea casată de output. 


Measure: MEASURE_1 


Toata of Wilhin-Subjocta Effects 


Errorţfactorl) 



Type III Sum 
of Squareş 

& 

Mean Squsjre 

Sphofioity Asşumed 

40.000 

2 

20.000 

Greenhpuse-Gelsser 

40.000 

1.758 

22.752 

Huynh-Feldt 

40.000 

2.000 

20.000 

Lower-bound V 

40.000 

1.000 

40.000 

Sphericity Assumed \ 

31.333 

8 

3.917 

Greenhouse-Geisser 

\ 31.333 

7.032 

4.456 

Huynh-Feldt 

\ 31.333 

8.000 

3.917 

lower-bound 

•\ 31.333 

4.000 

7.833 


Este necesară o parte redusă din output. în mare parte. Al cincilea tabel indică semnificaţia 
acesta este alcătuit din analize similare folosind teste Raportului F. Aceasta este de 0,037 
uşor diferite. Acestea sunt folosite atunci când Testul în condiţiile în care sfer 'atea este 
Mauchly din tabelul anterior de output este semnificativ. asumată. 


ANALIZA DE VARIANTA PENTRU SCORURI CUKiiLAlE oAu Mrtiu»w\iuKI REPElAiE io* 


SS Raportul F este media pătrată (MS) a factorului 1 (20,000) împărţită la media pătrată 
a Erorii (factorul 1) (3,917). Acesta are valoarea de 5,106 (20,000/3,917 - 5,1059). 
m Nivelul exact de semnificaţie a acestui Raport F este de 0,037. Din moment ce 
această valoare este mai mică de 0,05, putem trage concluzia că, per total, există o 
diferenţă semnificativă a scorurilor medii în cele trei condiţii. 
m Pentru a interpreta ce înseamnă analiza de varianţă în cazul datelor dumneavoastră, 
trebuie să aveţi în vedere media fiecăruia dintre cele trei grupuri de scoruri care sunt 
afişate în al doilea tabel. Acestea sunt 6,00, 8,00 şi 4,00. Care dintre aceste medii 
sunt semnificativ diferite de celelalte? 

S De asemenea, trebuie să ţineţi minte că, în cazul în care aveţi trei sau mai multe 
grupuri, trebuie să verificaţi unde se regăsesc diferenţele semnificative dintre perechile 
de grupuri. Procedura Testului t relaţionat descrisă în capitolul 12 explică acest 
lucru. în exemplul de faţă, doar diferenţa dintre mediile produsului X şi a metodei 
placebo a fost semnificativă. Din cauza faptului că efectuaţi mai multe Teste t, fiecare 
probabilitate exactă pentru testele t trebuie să fie înmulţită cu numărul Testului t care 
se efectuează. în exemplul nostru, există trei comparaţii, astfel încât fiecare proba¬ 
bilitate exactă trebuie să fie multiplicată cu 3. Acest procedeu este cunoscut sub 
numele de ajustarea sau corecţia Bonferroni (vezi ISP, capitolul 23). 



21.3. Raportarea output-ului 

m Putem descrie rezultatele acestei analize după cum urmează: „O analiză de varianţă 
one-way pentru scoruri relaţionate a indicat un efect semnificativ al tratamentului în 
cele trei condiţii (f 2 g = 5,10, p = 0,037). Media în cazul folosirii aspirinei a fost de 
6,00, media pentru produsul X a fost 8,00, iar media placebo a fost 4,00. Nici unul 
dintre cele trei tratamente nu a diferit faţă de celelalte în cazul Testelor t relaţionate, 
atunci când s-a făcut corecţia Bonferroni pentru respectivul număr de comparaţii”. 
m Această analiză ar putea fi însoţită de un tabel de rezumare a analizei de varianţă, aşa 
cum este tabelul 21.2. Medicamentele reprezintă „factorul 1” din output, iar eroarea 
reziduală este „Error (factor 1)” din al cincilea tabel din output, 

1 

Tabelul 21.2. Tabelul sumar al analizei de varianfă 



Sig.nific.int at 5% leveî. 









Analiza de varianţă bifactorială pentru 
scoruri nerelationate/necoreiate_ 


Rezumat 

n Analiza two-way de varianţă vă permite să comparaţi mediile unei variabile 
dependente atunci când există două variabile independente, 
w Dacă aveţi mai mult de o variabil cL^depondentâ, atunci nu trebuie decât să 
repetaţi analiza separat pentru fiecare variabilă. Pe de altă parte, dacă diferitele 
variabile dependente măsoară mai mult sau mai puţin acelaşi lucru, atunci 
acestea pot fi combinate într-o singură măsură generală folosindu-se proce¬ 
durile de însumare descrise în capitolul 17. 
st Cu aplicaţia SPSS, nuave\\ nevoie de un număr egal de valori în fiecare condiţie 
a variabilei independente. Dacă totuşi reuşiţi să aveţi un număr egal de numere 
în fiecare condiţie, analiza va fi optimă din punct de vedere statistic. 

■ Deşi analiza de varianţă two-way ANOVA poate fi considerată un model eficient- 
deoarece permite încorporarea în studiu a două variabile independente capa¬ 
citatea sa de a identifica interacţiunile poate fi şi ea importantă. O interacţiune 
nu este decât o situaţie în care efectul combinat a două variabile este mai mare 
decât suma efectelor fiecărei variabile care acţionează separat, 
s Metoda two-way ANOVA poate fi dificil de interpretat. Este important să ne 
concentrăm asupra mediei din fiecare condiţie, şi nu doar asupra complexităţilor 
output-ului statistic. Este important de observat că analizele varianţelor se desfă¬ 
şoară conform câtorva reguli. Efectele principale sunt identificate anterior inter¬ 
acţiunilor. Uneori, dacă nu avem grijă, interacţiunea este confundată cu efectul 
principal - pur şi simplu deoarece se reclamă variaţia pentru efectul principal 
înainte de a se reclama pentru interacţiune. Ca în cazul majorităţii analizelor 
statistice, este important să ne concentrăm cât mai mult asupra modelelor de 
medii din date drept probabilităţi statistice. 

Realizarea unei analize two-way pentru scoruri nerelaţionate de varianţă este exem¬ 
plificată folosind datele din tabelul 22.1. Tabelul indică scorurile obţinute de către diferiţi 
participanţi în şase condiţii, reflectând cei doi factori ai privării de somn şi alcoolul (ISP, 
tabelul 22.11). Scopul analizei este acela de a aprecia dacă diferitele combinaţii de alcool 
şi privare de somn afectează diferenţiat numărul mediu de greşeli făcute. 



22.1. Metoda two-way, 
Pasul 1 

Introduceţi datele. Cele două 
coduri pentru „Alcohol" 

(1 = Alcool şi 2 = Fără alcool) N 
se regăsesc în prima coloană. 

Cele trei coduri pentru 
„SleepDep" se regăsesc în a 
doua coloană (1=4 ore, 2 = 12 N, ‘< 
ore şi 3 = 24 ore). 

Greşelile sunt prezentate în a 
treia coloană. Etichetaţi aceste 
coduri după cum s-a precizat 
mai sus. Eliminaţi zecimalele din 
meniul „Variable View". 


pentru scoruri nerelaţionate 


ISleBgDiaKEn^ 


m i 

1 

16 

m i 

1 

12 

§3 1 

1 

17 

â * 

2 

18 


2 

16 

p? 1 

2 

25 

m i 

3 

22 

m i 

3 

24 


3 

32 

ML 

^2 

1 11 

33} 


i 9 

sEC 

X 2 

1 

12 : 

gjş 

O 

î^__2 

13 



2 

8 

Isl 

2 

\ 2 

11 

m 2 

X 3 

12 

£ 2 

3 

14* 

le 2 

3 

12 


Pasul 2 

Selectaţi „Analyze",-—— 
„General Linear Model" şi 
.Univariate...”. -— 


;Wr 



.‘■rcweţrta Cip' ,•>; 


fi 









Uiiiv.Hi.ite 


giCT.gpimi 




K>» ■; 


R'vswjrra 


Univariutc: QpUonir 




ariifcî&E 


• '.0.:l iV-~- 


Sleep depiivatlonfSI 


SleepDep 

AtcohoTSteepDep 


Pasul 3 

Selectaţi „Errors" şi apăsaţi 
butonul ► de lângă caseta 
„Dependent Variable:" 
pentru a introduce 
parametrul acolo. Selectaţi 
„Alcohol" şi „SleepDep” fie 
separat, fie împreună, şi 
apăsaţi pe butonul „Fixed 
Factor(s):" pentru a le 
introduce în casetă. 

Selectaţi „Options...". 


Selectaţi „Continue". 

în ecranul anterior, 
care va reapărea, 
selectaţi „Plots...". 


Selectaţi „Descriptive statistics' 
şl „Homogenelty tests' 


Pasul 4 


AN Al.IZ A DE VARiAN i A Blt'AC i GRiAi-A i un , 


. j lONAi'c... 


Selectaţi „Alcohol" şi apăsaţi 
butonul ► de lângă caseta— 
„Horlzonta! Axis:" pentru a 
introduce parametrul acolo. 

Selectaţi „SleepDep" şi — 
apăsaţi butonul ► de lângă 
caseta „Separate Lines:" 
pentru a introduce opţiunea în 
casetă. 

Selectaţi „Add". 

Selectaţi „Continue". - 

Apăsaţi „OK" în ecranul 
anterior, care va reapărea. 


22.2. Interpretarea output-ului 


Al doilea tabel conţine 
mediile, abaterile standard 
şi numărul (N) de cazuri 
pentru cele două variabile 
„Alcohol" şi „Sleep 
deprivation” luate separat 
sau împreună. Aşadar, 
media pentru condiţia 
„Alcohol" este comparată cu 
„Totalul" pentru „Sleep 
deprivation" (adică 20,22). 
Media pentru privarea de 4 
ore de somn este comparată 
cu „Total" pentru „Alcohol" 
(adică 12,83). 


Descriptive Statistic* 


Alcohol 

Sleep deprivation 

Maan 

Std. Deviation 

N 

Alcohol 

4 hrs 

16.00 

2.646 

3 


12 hrs 

19.67 

4.726 

3 


24 hrs 

26.00 

5.292 

3 


Total 

20.2?) 

6.099 

9 

No alcohol 

4 _£&-*~***~ 

10.67 

1,528 

3 


12 hrs 

10.67 

2.517 

3 

■— 

24 hrs 

12.67 

1.155 

3 


Total 

11.33 

1.871 

9 

Total 

4 N* — 

Q_12_63) 

3.061 

6 

_ — 

12 hfS 
* 24 hrs 

19.33 

8.066 

6 


Total 

15.78 

6.330 

18 


Levene's Test of Equatlty of Error Verisnces" 
Dependent Variable: Errors 


F 

dfl 

df2 / ^SÎg. * 

2.786 

5 

12 \^,068. 


Testează Ipoteza de nul conform căreia 
varlanţa de eroare pentru variabila depen¬ 
dentă este aceeaşi pentru toate grupele, 
a. Model: Intercept + Alcohol + SleepDep 
+ Alcoho!*SleepDep 


Al treilea tabel ne oferă informaţii referitoare 
la testul Levene, care verifică similaritatea 
varlanţelor. Din moment ce semnificaţia acestui 
test este de 0,068 (valoare care este mai mare 
,de 0,05), varlanţele sunt similare.Dacâ testul ar 
fi fost semnificativ, valorile ar trebui să fie 
transformate, de pildă, prin folosirea unei scale 
logarltmice pentru producerea similarităţii 
varlanţelor. Aceasta este o chestiune de 
încercare şi eroare - încercaţi diferite 
transformări până când varianţele devin 
similare. 
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Testa of Bstwecn-Subject» Effecîs 
Dependent Variable:’Errors 



Al patrulea tabel indică nivelele de semnificaţie pentru cele două 
variabile, „Aicohoi" şi „SleepDep”. şi interacţiunea dintre acestea. 

■ în tabelul de analiză a varianţei. Raportul F pentru cele două efecte principale 
(„Alcohol” şi „SleepDep”) este prezentat primul. 

® Pentru prima variabilă, cea a alcoolului, Raportul F este 31,683, ceea ce este 
semnificativ la nivelul 0,0005. Deoarece sunt numai două condiţii pentru ca acest 
efect să se producă, putem conchide că scorul mediu al uneia dintre condiţii este mult 
mai mare decât pentru cealaltă 

■ Pentru a doua variabilă a deprivării de somn, aceasta este egală cu 5,797, valoare 
care are un nivel exact de semnificaţie de 0,017. Cu alte cuvinte, Raportul F este 
semnificativ din punct de vedere statistic la nivel de 0,05, ceea ce înseamnă că 
mediile celor trei condiţii legate de somn nu sunt similare. 

M Mediile care diferă de celelalte pot fi determinate ulterior prin folosirea testelor prin 
comparaţii multiple, cum este Testul t pentru eşantioane independente. 

® Raportul F pentru interacţiunile dintre cele două variabile („ Alcohol *SleepDep") 
este de 2,708. Din moment ce nivelul exact de semnificaţie al acestui raport este de 
0,107, tragem concluzia că nu există nici o interacţiune semnificativă. 

Acest grafic este realizat pentru mediile celor şase condiţii. A fost editat cu ajutorul 

comenzii „Chart Editor”. Stilul liniilor colorate diferit a fost schimbat astfel încât să fie 

mai uşor de deosebit. 


Estimatei) Marginal Means of Errors 



Alcohol No alcohol 

Alcohol 





Apăsaţi butonul ▼ de lângă 
„Style" şi alegeţi stilul pe care- 
doriţi pentru linia respectivă. 
Modificaţi culoarea dacă doriţi. 

Selectaţi „Apply" şi apoi „Close' 

Selectaţi următoarea linie pe 
care doriţi să o editaţi şi 
repetaţi aceiaşi paşi. 


Illiilllill 
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22.3. Raportarea output-uiui 

« Putem raporta rezultatele din output după cum urmează: „O analiză de varianţă 
two-way ANOVA demonstrează obţinerea unor efecte semnificative în cazul alcoolului 
(F 2 ]2 - 31,68, p < 0,001) şi al privării de somn (F 212 = 5,80, p = 0,017), dar nu 
şi în cazul interacţiunii dintre cele două variabile (F 2 J2 — 2,70, p = 0,107)”. 

® De obicei, se realizează şi un tabel sumar al analizei de varianţă. Unul simplu, 
asemănător celui din tabelul 22.2, ar elimina unele informaţii care nu sunt necesare 
din al treilea tabel din output. 

« Din cauza faptului că factorul „SleepDep" are mai mult de două condiţii, trebuie să 
folosim un test prin comparaţii multiple adecvat, pentru a determina mediile ale căror 
grupuri diferă semnificativ (vezi capitolele 21 şi 23). 

a De asemenea, trebuie să raportăm mediile şi abaterile standard ale grupurilor care 
diferă semnificativ. Aceste statistici descriptive sunt date în al doilea tabel al output-ului. 

Tabelul 22.2. Tabel sumar al analizei de varianţă 


23 


Comparaţii multiple cu ANOVA 


Rezumat 

■ Acest capitol extinde aria de acoperire a Testelor / multiple din capitolele 20 şi 
21. Explică modul în care se decide care perechi de medii sunt diferite în mod 
semnificativ între ele, în cazul analizei de varianţă. 

a Tehnica se foloseşte atunci când aveţi mai mult de două medii. Nu adaugă 
informaţii suplimentare dacă există doar două valori medii. 

■ Procedurile ANOVA cu mai mult de două perechi de medii vor avea cu siguranţă 
de profitat de pe urma folosirii metodelor de comparaţie multiplă. 

■ Este imposibil să se ofere o regulă general valabilă referitoare la testul prin 
comparaţii multiple care ar trebui folosit în diferite situaţii, deoarece literatura de 
specialitate nu s-a pus de acord în această privinţă. 

Este important să ştiţi cu exactitate în ce constau diferenţele semnificative dintre 
diferitele condiţii ale studiului dumneavoastră. Curentul general în studiile ANOVA vă 
poate oferi o parte din adevăr. SPSS conţine un număr de proceduri ulterioare care se 
aplică, desigur, după colectarea datelor şi nu sunt planificate de la început. Toate acestea 
funcţionează în moduri uşor diferite. Există o discuţie detaliată pe această temă în 
Howell (2002). Vom ilustra folosirea acestor proceduri de comparaţii multiple (folosind 
informaţiile din tabelul 23.1, care au fost discutate anterior în capitolul 20). 

a 

Tabelul 23.1. Informaţii pentru un studiu asupra efectelor hormonilor 
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Pasul 3 


Selectaţi opţiunea „Condition" şi 
apăsaţi butonul « de lângă caseta 
„Factor:" pentru a introduce 
această opţiune în casetă. 


Alegeţi opţiunea „Post Hoc,..' 


23.1. Testele prin comparaţii multiple 


Pasul 1 

Selectaţi fişierul cu date 
dacă îl aveţi salvat. 
Dacă nu, introduceţi 
datele. 


mmrnmW 
m _i 

9 

m ■ i 

12 

83 i 

8 

m 2 

4 

m 2 

2 

m 2 

5 

m 3 

3 

p 3 . 

6 

m 3 

3 

«***1 i * 


Pasul 2 


Selectaţi opţiunile „Ani 
„Compare Means” 
şi „One-way ANOVA". 


Selectaţi opţiunea „Depression” şi 
apăsaţi butonul ► de lângă caseta 
„Dependent List:" pentru a 
duce această opţiune în casetă. 


COMPARAŢII MULTIPLE CU ANOVA 


Pas u' 



Selectaţi „Tukey", 
„Duncan" şi „Scheffe" 

Alegeţi „Continue". 

Selectaţi „OK" în ecranul 
anterior, C3re va apărea 
din nou. 


23.2. Interpretarea output-ului 

ANOVA 


Depression 



Primul tabel reprezintă rezultatele analizei de varianţă. 
Raportul F pentru efectul dintre grupuri (adică efectul 
hormonilor) este 10,586, care are un nivel exact de 
semnificaţie de 0,011. Cu alte cuvinte, efectul dintre 
grupuri este semnificativ. Per total, mediile pentru 
cele trei grupuri diferă. 
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Tabelele al doilea şi ultimul oferă rezultatele celor trei teste de comparaţii multiple. 

• Multipla Comporiaons 


Dependent Varlabie: Depressfon 


(I) Condition • ( 


Llwtejynsu hormone i I 


(J) Condition 


Hormone 2 
Placebo control 

Hormone 1 
Placebo control 


Placebo control Hormone 1 
Hormone 2 

Hormone 1 Hormone 2 

Placebo control 

Hormone 2 Hormone 1 

Placebo control 

Placebo control Hormone 1 
Hormone 2 


Mean 

Difference 

<w> 

Std. Error 

Sig. 

6.000* 

1.466 

.015 

5.667' 

1.466 

.019 

-6.000* 

1.466 

.015 

-.333 

1.466 

.972 

-5.667* 

1.466 

.019 

.333 

1.466 

.972 

6.000* 

1.466 

.018 

5.667* 

1.466 

.023 

-6.000* 

1.466 

.018 

-.333 

1.466 

.975 

-5.667* 

1.466 

.023 

.333 

1.466 

— 

.975 


* Diferenţa dintre medii este semnificativă la nivelul de ,0{ 


95% Confidence Interval 
Sig. LowerBound | UpperBound 


De exemplu, dacă folosim Testul Tukey al diferenţei semnificative 
oneste (HSD), media la grupul hormonului 1 este semnificativ 
diferită de media la grupul hormonului 2 (semnificaţia = 0,015) şi 
media grupului Controlului placebo (semnificaţia - 0,019). 


Subgrupele omogene 

Depresalon 


Subset for alpha « .05 


Condition 

N 


2 

Hormone 2 

3 

■ 3.67 


Placebo control 

3 

4.00 


Hormone 1 

3 

i 


Sig. 


ViJ 

Vj.000, 

Hormone 2 

3 

a67 


Placebo control 

3 

4.00 


Hormone 1 

3 


9.67 

Sig. 


.828 

1.000 

Hormone 2 

3 

3.67 


Placebo control 

3 

4.00 


Hormone 1 

3 


S.67 

Sig. 


.975 

1.000 


Grupul hormonului 2 şi al 
controlului placebo aparţin 
aceleiaşi subgrupe, ceea ce 
înseamnă că nu sunt 
semnificativ diferite. 


Grupuî hormonului 1 este 
singurul din această a doua 
subgrupă. Aşadar, aceasta 
este semnificativ di f erită de 
mediile celorlalte două grupe. 


Sunt reprezentate mediile grupelor din subgrupele omogene, 
a. Foloseşte Media armonică a dimensiunilor eşantioaoalor = 3,000, 


COMPARAŢII MULTIPLE CU ANOVA 
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■ Tabelul final, intitutlat „Subgrupele omogene”, enumeră grupurile de medii care nu 
sunt semnificativ diferite între ele. Aşadar, dacă luăm aceste rânduri pentru a le folosi 
în Testul Tukey HSD, în acest caz există două subgrupe de medii. Subgrupa 1 indică 
făptui că mediile grupelor hormonului 2 şi ale controlului placebo cu valorile de 3,67 
şi 4,00 nu diferă semnificativ. Subgrupa 2 conţine doar media grupei hormonului 1, 
în valoare de 9,67. Aşadar, media grupului hormonului 1 este semnificativ diferită 
atât de media grupei hormonului 2, cât şi de cea a grupelor de control placebo. 
Totuşi, aceasta înseamnă că grupele hormonului 2 şi cele ale controlului placebo nu 
sunt semnificativ diferite, fn acest fel, modelul este identic şi în cazul Testelor 
Duncan şi Scheffe, deşi acest lucru nu este întotdeauna adevărat. 

■ Aşadar, toate cele trei teste prin comparaţii multiple sugerează acelaşi lucru: faptul 
că există diferenţe semnificative între grupele hormonului 1 şi hormonului 2 şi între 
grupele hormonului 1 şi cele ale controlului placebo. Alte diferenţe nu mai există. 
Aşadar, nu este posibil, de exemplu, să spunem că grupele hormonului 1 şi hormo¬ 
nului 2 sunt semnificativ diferite. 

■ Alegerea unuia dintre cele trei teste nu este una uşoară. Howelî (2002) ne oferă câteva 
recomandări. 


23.3. Raportarea output-ului 

Putem raporta rezultatele output-ului după cum urmează: „O analiză de varianţă 
unifactorială pentru scoruri necorelate a demonstrat producerea unui efect general 
semnificativ pe tip de tratament medicamentos (F m ~ 10,59, p - 0,011). Prin Metoda 
Scheffâ de analiză a intervalului s-a descoperit că grupul hormonului 1 era diferit de 
grupul hormonului 2 (p = 0,018) şi de grupul controlului placebo (p = 0,023), dar nu 
s-au mai găsit alte diferenţe semnificative”. 

Lucrări de referinţă 

A 

Howelî, D. (2002), Statisîical Methods for Psychology (ediţia a V-a, Duxbury Press: 
Boston). 
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Rezumat 

n Analiza de covarianţă îi permite cercetătorului să controleze şi să facă adaptări 
pentru variabilele care se corelează cu variabila dependentă pe care o aveţi, 
pfin compararea mediilor de la nivelul variabilei dependente. Aceste variabile 
sunt cunoscute ca fiind covariate'ale variabilei dependente. 
bi în măsura în care nivelele variabilelor covariate sunt diferite în funcţie ds 
condiţiile cercetării dumneavoastră, dacă nu vă ajustaţi variabila dependentă, 
variabilele covariate, veţi încurca efectele variabilelor independente pe care le 
aveţi cu influenţa exercitată de către diferenţele preexistente dintre condiţiile 
produse de diferite nivele ale covariatelor. 

« Prin controlul variabilelor covariate, nu faceţi decât să îndepărtaţi efectul pe 
care acestea îl au asupra scorurilor pe care le deţineţi în ceea ce priveşte 
variabila dependentă. Aşadar, după ce aţi făcut ajustările necesare pentru 
variabilele covariate, variaţia care rămâne între condiţii nu se poate datora 
covariatelor. 

■ Una dintre utilizările obişnuite ale metodei ANCOVA se regăseşte la nivelul 
proiectelor anterioare şi ulterioare testelor. Presupunând că demersul anterior 
testului vă sugerează că diferitele condiţii ale experimentului au medii diferite 
înaintea testării (de exemplu, grupurile experimentale şi cele de control sunt 
diferite), metoda ANCOVA poate fi folosită pentru ajustarea acestor diferenţe. 

■ Un model de analiză mixtă a varianţei nu este decât un model de cercetare 
bifactorială (sau trifactoriaiă etc.) care conţine atât variabile pentru eşantioane 
independente, cât şi variabile pentru eşantioane perechi. 

* Modelele mixte generează măsuri cu mult mai complexe de estimare a erorilor, 
în comparaţie cu alte forme ale metodei ANOVA. Aceasta înseamnă că trebuie 
să aveţi mare grijă atunci când realizaţi tabelele de sumar corespunzătoare. 

Analiza covarianţei este în mare parte identică analizei de variantă tratată în alte 
lucrări, având însă o diferenţă esenţială. Aceasta constă în faptul că efectele variabilelor 
adiţionale (covariatelor) sunt îndepărtate şi nu mai fac parte din analiză. Este ca şi cum 
am folosi corelaţia parţială pentru a scăpa de efectele unei a treia variabile asupra unei 
corelaţii. Vom ilustra procesarea unei analize a covarianţei (ANCOVA), folosind datele 
din tabelul 24.1, care sunt aceleaşi cu cele din tabelul 20.1, cu diferenţa că au fost 
incluse şi scorurile depresiei, măsurate chiar înainte de cele trei tratamente. 
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Tabelul 24.1. Date pentru studiul efectelor hormonilor (analiza covarianţei) 


i 



* 


Este posibil ca diferenţele înregistrate în nivelul depresiei înainte de tratament să 
afecteze rezultatul final al analizei. Practic, prin ajustarea scorurilor variabilei dependente 
pentru eliminarea acestor diferenţe preexistente, este posibil să nu mai luăm în considerare 
posibilitatea ca aceste diferenţe preexistente să afecteze analiza. Aşadar, daoft (a) scorurile 
anterioare tratamentului sau testului sunt corelate cu scorurile ulterioare tratamentului 
sau testului, iar (b) scorurile anterioare testului sunt diferite în cazul celor trei tratamente, 
atunci aceste diferenţe sesizate înaintea testului pot fi controlate din punct de vedere 
statistic prin eliminarea lor din analiză, folosind covarianţa. 



m 


24.1. Analiza one-way ANCOVA 



Pasul 1 

Introduceţi datele. 

Primele două coloane 
conţin date similare ceior" 
din capi-tolele 20 şi 23. 
Datele din cea de-a treia 
coloană sunt noi. 
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Pasul 2 



Selectaţi 
„Analyze", 
Linear Model" şi 
„Unlvariato..." 
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Pasui 3 

Selectaţi opţiunea „Posttest” 
şi apăsaţi butonul ► de lângă 
caseta .Dependent Variable:"" 
pentru a introduce această 
opţiune în casetă. 

Selectaţi opţiunea „Condition” 
şi apăsaţi butonul ► de lângă 
caseta „Fixed Factor(s):” 
pentru a intro-duce această 
opţiune în casetă. 

Selectaţi opţiunea „Pretest" şi 
apăsaţi butonul •< de lângă 
caseta „Covariate(s):" pentru 
a introduce această opţiune 
în casetă. 

Selectaţi „Options...". 


Pasul 4 

Selectaţi „Condition" şi 
apăsaţi butonul « pentru a 
introduce opţiunea în caseta 
„Display Means for:”. 

Selectaţi „Descriptive 
statistics". 

Selectaţi „Continue". 

Apăsaţi „OK" în ecranul 
anterior, care reapare. 
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Test» of Between-Subjects Effecis 


Dependent Variable: Posttest 



a, R Squared = .801 (Adjusted RSquared = .682) 


îrt urma îndepărtării efectelor covariatei, nu mai există o diferenţă 
semnificativă între mediile din cele trei situaţii, deoarece semnificaţia 
este de 0,099, care pu este semnificativă din punct de vedere statistic. 


Raportul F al efectului principal are valoarea de 3,796 (13,213/3,481 - 3,796). 
Probabilitatea acestui Raport F este de 0,099. Cu alte cuvinte, este mai mare decât 
valoarea critică de 0,05 şi, în consecinţă, nu este semnificativ din punct de vedere 
statistic. 


24.3. Raportarea output-uiui 

® Putem raporta rezultatele output-ului după cum urmează: „Metoda one-way 
ANCOVA a demonstrat că, în momentul în care din evaluarea depresiei anterioare 
testului a fost eliminat efectul covariatei, efectul principal al tratamentului asupra 
depresiei ulterioare testului nu a fost semnificativ (F 225 — 3,79, p — 0,099). Variabila 
covariată - scorurile depresiei anterioare tratamentului - avea un efect semnificativ 
asupra scorurilor depresiei ulterioare tratamentului”. în mod normal, ar trebui să 
raportaţi şi schimbările de la nivelul valorilor medii, realizate în momentul în care 
covariata a fost îndepărtată. 

® în plus, în mod obişnuit se introduce şi un tabel sumar ANCOVA, cum este tabelul 24.2. 


Tabelul 24.2. Tabelul sumar ANCOVA al efectelor tratamentelor pentru 
controlarea depresiei asupra depresiei anterioare tratamentelor 
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24.4. Modelul 2-way ANOVA mixt 

O analiză two-way mixtă realizată asupra varianţei are un factor care presupune eşantioane 
independente (scoruri necorelate) şi unul care presupune eşantioane perechi (scoruri 
corelate). Factorii sunt variabile independente. Această analiză este ilustrată folosind datele 
din tabelul 24.3 (ISP, tabelul 24,6), care conţine scorurile respectului de sine la copii, 
măsurate înainte şi după o manipulare experimentală în cadrul căreia jumătate dintre copii 
(aleşi în mod aleatoriu) 8U fost. lăudaţi pentru comportamentul lor (condiţie experi¬ 
mentală), iar celeilalte jumătăţi nu i s-a oferit nici un fel de feedback (condiţie de control). 


Tabelul 24.3. Nivelele respectului de sine anterioare 
şi ulterioare testului, in două condiţii 



Introduceţi datele. Codurile 
pentru cele două condiţii 
(1 = Condiţie de control şi 
2 = Condiţie experimentală) se 
regăsesc în prima coloană. 
Etichetaţi aceste valori ca atare. 
Valorile numerice anterioare şi 
ulterioare testului se află în 
coloanele a doua şi a treia. 


Pasul 2 

Selectaţi „Analyze", 
„General Linear Model" şi 
„Repeated measures...". 























bbsbr 
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Pasul 4 

Selectaţi „Pretest" şi 
„Posttest" fie separat, fie 
împreună, apoi apăsaţi 
butonul ► de lângă caseta 
„Within-Subjects Variables:" 
pentru a introduce aceste 
opţiuni în casetă. 

Selectaţi „Condltlon" şi 
apăsaţi butonul < d© lângă 
caseta „Between-Subjects 
Faetor(s): M pentru a Intro¬ 
duce opţiunea în casetă. 

Selectaţi „Options...”, 


1/8 
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Pasul 3 


Tastaţi „2" în caseta 
„Number of levels:". 


Selectaţi „Add". 


Selectaţi „Define". 



(OVERALLi 


Condtion 

factort 

Concition'lâclod 


CohSnăjj 

W. !.-• .1 ■'■‘I 
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Pasul 6 


Selectaţi „factori („Pretest 
„Posttest") şi apăsaţi butonul ► 
de lângă caseta „Horizontal 
Axis:" pentru a adăuga 
opţiunea în casetă. 


Selectaţi opţiunea „Condltlon" 
şl apăsaţi butonul ■« de lângă 
caseta „Separate Lines:" 
pentru a introduce opţiunea 
în casetă. -- 


Selectaţi „Add . 
Selectaţi „Continue". 


Apăsaţi „OK in ecranul 
anterior, care va reapărea. 


Pasul 5 


Selectaţi „Descriptive statistics 
şi „Homogeneity tests”. . 

Selectaţi „Continue". \ 

în caseta anterioarăA \ 

care va reapărea, \ \ 

selectaţi „Plots...". \ \ 
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24.5. Interpretarea output-ului 

Output-ul oferă zece tabele şi un plot. Aici sunt prezentate doar tabelele cele mai importante. 


Descriptive Statistic» 


Condition 


ISSESES1S1 


Control 11 5.00 

Experimentalii 5.67 
5.33 


Ai doilea tabel conţine 
media şi abaterea 
standard pentru cele două 
grupuri. 


Al treilea tabel arată măsura în care matricele covarianţelor ulterioare testelor sunt egale 
în cele două situaţii. Această analiză a varianţei presupune că sunt egale. Din moment 
ce nivelul de semnificaţie de 0,951 este mai mare de 0,05, matricele sunt similare şi 
această presupunere se dovedeşte a fi adevărată. 




Box's Test of Equality of Covarianca Matricea 1 * 


Box’s M 

.757 

F 

.115 

dfl 

3 

df2 

2880.000 

Sig. 

.951 > 


Verificaţi ca această valoare să nu fie mai mică 
de 0,05. Dacă valoarea nu este semnificativă 
'{aşa cum este în acest caz), covarianţele 
grupurilor sunt egale în urma testelor. 


Testează ipoteza de nul conform căreia matricele de covarianţă 
observate ale variabilelor dependente sunt egale de la un grup la altul, 
a. Model: Interceptare + Condiţie 
Modei la nivelul subiecţilor: factor 1 

Cel de-al nouălea tabel arată măsura în care varianţa de eroare a celor două variabile este 
similară în cele două condiţii. Un nivel de semnificaţie mai mare de 0,05 indică faptul 
că aceste varianţe sunt similare. 


Levene's Toat of Equality of Error Variances" 



F 

dfl 

df2 


Pretest 

.308 

1 

4 

.609 

Posttest 

.000 

1 

4 

\L000, 


Testează ipoteza de nul conform căreia varianţa 
de eroare a variabilelor dependente este egală 
de la un grup ia altul, 
a. Model: Interceptare + Condiţie 
Model la nivelul subiecţilor: factor 1 


Verificaţi această coloană pentru a 
vedea nivelul semnificaţiei. Semnificaţia 
înseamnă că varianţele de eroare sunt 
seminificativ diferite în cazul celor două 
sau mai multe condiţii - fie în condiţiile 
anterioare testului, fie ulterior acestuia. 
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Cel c •?, Ai optulea tabel conţine in: armaţii pentru Testul F. Testul Fcare ne interesează în 
mod deosebit este cel referitor la interacţiunea dintre factorii de la nivelul subiecţilor şi cei 
care acţionează între subiecţi (factor 1 * Condiţie). Acest Raport Feste de 7,682 şi are o valoare 
de probabilitate de 0,05. Cu alte cuvinte, această interacţiune este semnificativă la limită. 
Dacă ne uităm la mediile pentru cele patru grupuri, vom vedea că pe măsură ce media pentru 
condiţia de control înregistrează o creştere scăzută de la valoarea anterioară testului (5,00) 
la cea ulterioară testului (6,00), media pentru condiţia experimentală manifestă o creştere 
mai accentuată de la nivelul anterioară testului (5,67) la cel superioară testului (11,00). 


Tests of Within-Subjects Contrasts 


Measure: MEASURE 1 




factori Linear 


factori * Condition Linear 


Error(factorl) Linear 


Type III Sum 
of Squares 

df 

Mean Square 

30.083 

1 

30.083 

14.083 j 

1 

14.083 

7.333 

4 

1.833 




Această valoare indică o interacţiune semnificativă la limită între valorile anterioară 
şi ulterioare testului pe de o parte şi condiţia experimentală pe de altă parte. Cu alte 
cuvinte, există între celule diferenţe care nu pot fi explicate de diferenţele preexis¬ 
tente dintre grupurile de participanţi sau pur şi simplu de schimbările tuturor 
condiţiilor între momentul anterior şi cel ulterior testului. Uitaţi-vă la tabelul 24.5 
şi veţi avea o imagine mai clară asupra tendinţelor de la nivelul mediilor. 


® Pentru a determina dacă aceste creşteri sunt semnificative din punct de vedere statistic, 
am putea să efectuăm un Test t pentru eşantioane perechi între scorurile anterioare şi 
ulterioare testului, separat pentru cele două condiţii (folosind corecţia Bonferroni 
pentru numărul de comparaţii pe care le vom efectua). 

* De asemenea, putem vedea dacă cele două condiţii erau diferite Ia testul anterior şi 
la cel ulterior cu ajutorul unui Test t pentru eşantioane independente, efectuat separat 
pentru cele două perioade de testare. 


Graficul prezentat în continuare ilustrează media celor patru celule, care vă poate 
ajuta să înţelegeţi mai uşor relaţia dintre ele. Acesta a fost editat pentru schimbarea 
stilului liniilor, aşa cum s-a explicat în capitolul 22. 
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24.6. Raportarea output-ului 

ffl Putem raporta rezultatele output-ului după cum urmează: „Interacţiunea dintre cele 
două condiţii şi schimbările care au avut loc în timp au fost semnificative din punct 
de vedere statistic (F 14 - 7,68, p = 0,05). Deşi mediile testului anterior nu erau 
semnificativ diferite (/ - 0,76, DF - 4, two-tailed p — 0,492), media ulterioară 
testului în cazul condiţiei experimentale (M = 11,00, SD = 1,00) era cu mult mai 
ridicată (t - 6,12, DF = 4, two-tailed p = 0,004) decât cea înregistrată în cazul 
condiţiei de control (M=6,00, SZ> = 1,00). Creşterea înregistrată de la testul 
anterior (M - 5,67, SD = 1,15) până la testul ulterior (M = 11,00, SC = 1,00) a 
fost semnificativă în cazul condiţiei experimentale (t = 4,44, DF - 2, two-tailed 
p — 0,047), dar nu şi în cazul celei de control (t — 1,00, DF~ 2, two-tailed p = 0,423)”. 

® Tabelul 24.4 este un tabel de analiză a varianţei pentru acest studiu. 

ffl De asemenea, va fi utilă includerea unui tabel al mediilor ( M) şi al abaterilor standard 
(SD), aşa cum se arată In tabelul 24.5. 



Tabelul 24.5. Mediile şi abaterile standard pentru momentele anterioare şi ulterioare 
testului, în cazul condiţiilor de control şi ale celor experimentale 




A |“ Citirea fişierelor ASCII sau a Fişierelor 
text cu ajutorul opţiun ii „Data Edito r” 


Rezumat 

■ Uneori, deţineţi un fişier cu date pe care doriţi sâ le folosiţi în SPSS. Acest 
capitol vă explică modul în care puteţi folosi date care încă nu sunt introduse în 
foaia de lucru „Data Editor" a SPSS-ului. 

■ Deşi ca studenţi veţi avea rareori nevoie sâ folosiţi fişiere ASCII, există un 
număr de baze de date cu informaţii arhivate pe care cercetătorii ar dori, 
probabil, să le analizeze. 

a Merită sâ remarcăm faptul că uneori informaţiile din alte foi de lucru pot fi introduse 
în SPSS. De exemplu, datele din foile de lucru Excel pot fi pur şi simplu copiate şi 
lipite în SPSS, dar acest lucru nu este posibil totuşi cu întreaga foaie de lucru Excel. 
De asemenea, informaţiile din SPSS pot fi salvate sub forma unui fişier Excel. 


25.1. Introducere 

SPSS pentru Windows este unu! dintre numeroasele programe diferite pentru analizarea 
datelor. Există situaţii în care cercetătorii pot avea nevoie să folosească pachete informa¬ 
ţionale pe care le-au pregătit pentru un alt computer şi să ruleze acele informaţii în SPSS 
pentru Windows. Poate fi costisitor atât din punct de vedere al timpului, cât şi din cel al 
banilor să reintroducem, de exemplu, în foaia de lucru „Data Editor” datele dintr-un 
sondaj de amploare. Uneori, singura formă în care sunt disponibile datele este aceea a 
unui fişier dintr-o arhivă electronică ; este posibil să nu mai existe chestionarele iniţiale. 
Indiferent de motivul pentru care se foloseşte un fişier cu date importate, SPSS pentru 
Windows poate accepta fişierele şi sub alte forme. Mai precis, fişierele cu date sunt 
uneori scrise ca simplu text sau ca fişiere ASCII, din moment ce acestea pot ft transferate 
cu uşurinţă de la un tip de computer la altul. ASCII înseamnă „American Standard Code 
for Information Interchange”. Pentru ? analiza un fişier de date ASCII, trebuie mai întâi 

să îl citiţi cu ajutorul opţiunii „Data Editor”. 

Să presupunem, de exemplu, că aveţi un fişier de date ASCII numit „data.txt ’ care 

conţine următoarele numere: 


■- . 
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Evident, nu puteţi folosi raţionai un fişier ASCII înainte de a şti exact unde este 
informaţia pentru fiecare variabilă. Totuşi, noi ştim ce informaţii conţine micul fişier de 
mai sus şi unde se găsesc acestea. Cifrele din prima coloană nu fac decât să numeroteze 
trei participanţi diferiţi despre care deţinem informaţii. Valorile din cea de-a doua 
coloană conţin codul pentru gen, „1” reprezentând femeile şi „2” - bărbaţii, iar valorile 
din coloanele a treia şi a patra indică vârstele celor trei persoane. Vom efectua următoarea 
procedură pentru a introduce fişierul de date ASCII în „Data Editor”. 


25.2. Cum să citim un fişier de date 
ASCII sau un fişier text 


Pasul 1 

Selectaţi „File" şi ~ 
„Read Text Data...". • 


mmm 


Open • 


OpertD 


Pasul 2 

Selectează butonul ▼ din 
caseta „Look in:" pentru ■ 
a găsi fişierul de date 
(de exemplu, data). 

Selectaţi fişierul. 

Selectaţi „Open". 


h Look ’k [gSTgHsÎF" 

.1 El Brldgel Nes 
EKXntan's 
■’ EjPIfwJ 


Ffc*«ţţW*: | Iod CM) 



Pasul 4 

Selectaţi „Next". 


u: :trea fişierelor ascei saju a fişierelor text cu ajutorul opţiunii 


Paşii c 

Selectaţi „Next". 
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Pasui 5 

Selectaţi „Next". 


Selectaţi „Next' 


Daţi clic imediat după prima coioană ; 
deoarece această coioană conţine 
numărul participantului. \ 

Daţi clic după a doua coloană \ 
care conţine codul genului. \ \ 

Ultimele două coloane conţin \ ' 
vârsta. \ 

Selectaţi „Next". . \ 


Selectaţi „Finish’ 


Datele textului au fost 
introduse în „Data 
Editor” şi pot fi salvate 
sub formă de fişier 
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AŢIA PARŢIALĂ 


26,1. C : elaţia parţială 


Corel aţia parţia lă 


Pasul 1 

în fereastra „Variable View" din „Data 
Editor", denumiţi cele trei coloane. 
„NumJQ", „VerbJQ" şi „Age". 

înlăturaţi cele două zecimale prin 
introducerea valorii 0. 


Numeric 


Numeric 


Rezumat 


Pasul 2 

în feresastra „Data View" din 
„Data Editor", introduceţi 
valorile IQ-ulul numeric în 
prima coloană, cele ale IQ-ulul 
verbal în a doua coloană, iar 
vârsta în cea de-a treia 
coloană. 


* Dacă bănuiţi că o corelaţie dintre două variabile este afectată de corelaţia 
acestora cu o a treia variabilă, este posibil să faceţi adaptării© necesare pentru 
efectele acestei variabile suplimentare prin folosirea procedurii de corelaţie 
parţială. 

a Corelaţia dintre două variabile (înainte de parţializare) este cunoscută sub 
numele de corelaţie de ordin zero. 

a Prin folosirea aplicaţiei SPSS, este posibilă şi controlarea simultană a mai 
multor variabile care pot afecta coeficientul de corelaţie. 

m Dacă variabila pe care trebuie să o controlaţi este formată dintr-un număr mic 
de categorii nominale, este util să observaţi corelaţiile pe grupuri separate de 
cazuri, pe baza variabilei de control. De exemplu, dacă trebuie să controlaţi 
genul, atunci va trebui să vă separaţi eşantionul într-un subeşantion de bărbaţi 
şi într-unul de femei. Observaţi care sunt corelaţiile dintre variabilele principale 
în cazul acestor două grupuri. De multe ori, acest procedeu clarifică efectul 
parţializării într-un mod surprinzător. 


Pasul 3 

Selectaţi comenzile 
„Analyze", „Correlate’ 
şi „Parţial...". 




Aplicaţia SPSS pentru Windows nu procesează cu uşurinţă corelaţiile parţiale dintr-o 
matrice de corelaţii de ordin zero (adică, dacă valorile corelaţiilor dintre variabilele 
analizate sunt introduse direct). în consecinţă, vom ilustra procesarea corelaţiilor parţiale 
cu scorurile brute din tabelul 26.1, care reprezintă scorurile la testul de inteligenţă 
numerică, la testul de inteligenţă verbală şi vârsta în ani. Vom corela scorurile la cele 
două teste, parţializând vârsta. 


Pasul 4 


Selectaţi „NumJQ'' şi 
„VerbJQ", apoi apăsaţi 
butonul ► pentru a intro¬ 
duce aceste două variabile 
în caseta „Variabies:". 

Selectaţi „Age" şi apăsaţi 
butonul ► pentru a intro-“ 
duce variabila în caseta 
„ControIHng for:", 

Selectaţi „OK". 


Tabelul 26.1. Rezultatele la testele de inteligenţă numerică şi verbală şi vârsta 
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26.2. Interpretarea output-ului 


Corelaţia parţială dintre valorile IQ-ului 
numeric şi ale celui verbal care ajută la 
controlarea variabilei vârstei este de 0,776. 


Această celulă oferă 
aceleaşi informaţii ca şi 
celula din dreapta sus. 



Semnificaţia bilaterală este de 0,224, 
valoare care nu este semnificativă. 
Există două trepte de libertate. 


26.3. Raportarea rezultatelor 

Trebuie să menţionăm corelaţia iniţială dintre inteligenţa numerică şi cea verbală, care 
est© de 0,92, Aşadar, m putea raporta rezultatele după eum urmează: „Corelaţia dintre 
inteligenţa numerică şi cea verbală este de 0,92 (DF 3, two-tailed p = 0,025). Totuşi, 
corelaţia dintre inteligenţa numerică şi cea verbală atunci când este controlat parametrul 
vârstei scade la 0,78, valoare care nu este semnificativă (two-tailed p — 0,224). Cu alte 
cuvinte, nu există o relaţie semnificativă între inteligenţa numerică şi cea verbală atunci 
când parametrul vârstei este controlat”. 


Analiza factorială 




Rezumat 



n Există două tipuri de analiză factorială: analiza factorială exploratorie şi cea 
confirmatoare. Aplicaţia SPSS nu procesează analiza factorială confirmatoare 
. în mod direct. Analiza factorială exploratorie este, probabil, cea mai importanta 
şi SPSS-ul deţineţi un pachet complet de opţiuni pentru aceasta. 

■ Analiza factorială (exploratorie) permite extragerea unor concluzii logice atunci 
când operăm cu un set complex de variabile, reducându-le la un număr mai mic 
de factori (sau supervariabile) care înlocuiesc multe dintre variabilele iniţiale. 
Deşi este posibil să obţinem informaţii valoroase dintr-o matrice de corelaţii 
dintre diferite variabile, dimensiunea mare a matricei poate îngreuna aceasta 
operaţiune chiar şi atunci când operăm cu un număr relativ mic de variabile. _ 

M Analiza factorială este folosită în mod obişnuit atunci când cercetătorul mcearca 
să înţeleagă modelul reacţiilor persoanelor care completează chestionare cu 
întrebări închise. Elementele care măsoară aspecte similare pot fi identificate 
prin analiză factorială şi, în consecinţă, pot fi deduse din structura răspunsurilor 
date la întrebările din chestionar. 

a Totuşi, analiza factorială presupune o varietate de tehnici şi abordări pe care e 
puteţi considera prea complicate. Vă vom oferi o abordare „standard care este 
folositoare în urmărirea obiectivelor majorităţii cercetătorilor, 
a Analiza factorială necesită un oarecare discernământ, mai ales in ceea ce 
priveşte numărul de factori care trebuie extraşi. Viteza analizelor factoriale 
efectuate cu ajutorui computerului vă permite să încercaţi mai multe abordări 
chiar în cadrul unei sesiuni scurte de analiză. Este bine să vedeţi care sunt 
rezultatele varierii metodei de analiză pentru a aprecia efectele pe care le are 
acest procedeu asupra concluziilor pe care le trageţi. 

Procesarea unei analize factoriale a componentelor principale este exemplificată cu 
datele din tabelul 27.1, care reprezintă scorurile a şase variabile măsurate m cazul a nouă 
indivizi. Acest studiu are doar un rol ilustrativ; ar fi caraghios să efectuăm o analiză 
factorială pentru un număr atât de mic de cazuri. în mod obişnuit, ar trebui să aveţi m 
vedere lucrul cu un număr de cazuri care să reprezinte dublul sau triplul numărului de 
variabile de care dispuneţi. Următorul studiu este o analiză factorială ^ndard ^e e 
potrivită majorităţii situaţiilor. Totuşi, aplicaţia SPSS are multe opţiuni pentru anali 

factorială. 
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Tabelul 27.1. Scorurile a şase variabile obţinute de nouă persoan. 






27.1. Analiza pe componente principale 
cu rotaţie ortogonală 


introduceţi datele, 


Pasul 2 

Selectaţi „Analyze’ 
„Data Reduction" 
şi „Factor...”. 



[Factoi 


Pasul 5 

Selectaţi „Scree plot". 
Selectaţi „Continue”. 


Pasul 4 


Selectaţi „Coefficients 
Selectaţi „Continue”. 


ANALIZA FACTORIALĂ 


Pasul 3 


Selectaţi cele şg ,a variabile 
fie separat, fie împreună şi 
apăsaţi butonul < pentru a 
le introduce în caseta 
„Variables:”. 


Selectaţi „Descriptives...”. 
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Pasul 6 

Selectaţi „Varimax". 
Selectaţi „Continue”. 




Pasul 7 

Selectaţi „Sorted by size' 
şl selectaţi „Continue". s 

Apăsaţi „OK" ca 
în ecranul iniţial. 


£rti»ieioyaio»TŢjEJjjs 
•Wp , 'C 


27.2. Interpretarea output-ului 

* Primul tabel prezintă matricea de corelaţie. De aici, deducem că există două grupuri 
de variabile care sunt într-o relaţie puternică de corelaţie. Unul este format din jocul 
de baseball, jonglarea şi jocul de darts, iar celălalt din cuvinte încrucişate, scrabble 
şi jocuri de ortografiere a cuvintelor. Aceste grupuri au fost deja indicate, dar ţineţi 
minte că, din moment ce o matrice de corelaţie este simetrică, doar jumătatea 
inferioară situată sub diagonală a fost marcată. în tnod obişnuit, în analiza factorială, 
matricea de corelaţie este mult mai greu de descifrat decât în acest caz. Datele cazului 
nostru au fost mult stilizate. 


Correlatlon Matrlx 



Deoarece analiza factorială presupune, de cele mai mute ori, o muiţime de variabile, Iar suprafaţa 
ecranului computerului este limitată, de obicei este greu să privim matricea de corelaţie în întregime. 
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s Al treilea tabel ne arată că în acest caz au fost extraşi iniţial doi factori referitori la 
componentele principale. Computerul ignoră factorii eigenvalue mai mici decât 1,00. 
Acest lucru se întâmplă deoarece astfel de factori manifestă o variaţie de eroare care 
nu poate fi interpretată. Desigur, este posibil ca analiza dumneavoastră să aibă chiar 
mai mulţi (sau mai puţini) factori. 



H Diagrama de tip scree plot ne arată că după al doilea factor apare o scădere a valorilor 
eigenvalue ale factorilor: linia este practic plată după al doilea factor. Din moment 
ce în analiza factorială este important să vă asiguraţi că nu aveţi prea mulţi factori, 
veţi dori, probabil, să vă efectuaţi propria analiză factorială şi rotaţia stipulând 
numărul de factori odată ce aveţi rezultatele testului efectuat prin metoda grafică 
scree plot. (Acest lucru se poate realiza prin introducerea numărului respectiv în 
comanda „Number of factors : ” din subcaseta de dialog „Factor Analysis: Extraction”. 
în cazul datelor noastre, nu este nevoie să facem acest lucru, deoarece computerul a 
folosit primii doi factori şi i-a ignorat pe ceilalţi din cauza valorii eigenvalue minime 
necesare de 1,00. Nu este o practică rară să se proceseze din nou analiza pe 
componente, având în vedere modelul care "rezultă. 


Scree Plot 



1 2 3 4 5 6 

Component Number 
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SS Aceste două componente sunt, mai apc-i, rotite în plan ortogonal şi ponderile celor 
şase variabile în cei doi factori sunt ilustrate în cel de-al cincilea tabel intitulat „Rotated 
Component Matrix”. 


Rotated Component Matrix* 


Component 

1 

2 

. Batting /L980N 

-.012 

Juggling ( .979 

-.011 

Darts 

TQ4 

Crosswords .006 

/.951\ 

Scrabble -.078 

( ,951. 

Spelling .153 

\9U/ 


Metoda de extragere: Analiza componentelor principale. 
Metoda de rotire: Varimax cu normalizare Kaiser 
a. Rotire tn trei etape. 


B Variabilele sunt ordonate şi sortate în funcţie de ponderea pe care o au în primul factor, 
de la cele care au cea mai mare pondere la cele cu ponderea cea mai redusă. Aceasta 
ajută la interpretarea factorului respectiv, deoarece elementele cu pondere mare sunt 
şi cele care vă ajută cel mai mult atunci când trebuie să identificaţi factorul respectiv, 
s în primul factor, jocul de baseball are cea mai mare pondere (0,980), aceasta fiind 
urmată de cea exercitată de jonglerii (0,979) şi de jocul de darts (0,962). 

H în cel de-al doilea factor, cea mai mare pondere o au cuvintele încrucişate (0,951), 
urmate de scrabble (0,951) şi de jocurile de ortografiere (0,914). Lipsa aparentă a 
diferenţei ponderii exercitate de cuvintele încrucişate şi de scrabble se datorează 
rotunjirii. Acest lucru se poate vedea dacă daţi dublu clic pe tabelul matricei 
componentelor rotite şi încă un dublu clic pe aceste două influenţe, Ia rândul lor. 
li Vom interpreta semnificaţia acestor factori în funcţie de conţinutul variabilelor care 
le-au influenţat cel mai mult. 

m Procentul varianţei pentru fiecare dintre factorii rotiţi ortogonal este dat în al treilea 
tabel în secţiunea „ % of variance” în secţiunea „Rotation Sums of Squared Loadings”. 
Această sumă este 47,931 pentru primul factor şi 44,236 pentru cel de-al doilea. 


27.3. Raportarea output-ului 

în mod obişnuit, factorii şi variabilele se tabulează dacă spaţiul disponibil o permite. Din 
moment ce informaţiile din exemplul nostru se referă la diferite teste de abilităţi, tabelul 
analizei factoriale ar putea fi similar tabelului 27.2. Cifrele au fost date cu o exactitate 
de două zecimale. 

■ Modalitatea exactă de raportare a rezultatelor unei analize factoriale depinde de 
scopul analizei. Una dintre modalităţile de descriere a rezultatelor ar fi următoarea: 
„S-a efectuat o analiză factorială pe componente principale pe baza corelaţiilor dintre 



ANALIZA FACTORIALĂ 197 

cele şase variabile. Iniţial, au fost extraşi doi factori care au coeficienţi eigenvalue 
mai mari sau egali cu 1,00. Rotirea ortogonală a factorilor a determinat structura 
factorială reprezentată în tabelul 27.2. Primul factor reprezenta 48% din varianţă, iar 
cei de-al doilea 44%. Primul factor pare a fi coordonarea ochi-mână, iar cel de-al 
doilea flexibilitatea verbală”. Din. cauza faptului că factorii trebuie să fie interpretaţi, 
pot apărea diferenţe de interpretare în analiza factorială. 

Tabelul 27.2. Matricea influenţei factorilor ortogonali pentru şase abilităţi 
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Regresia multiplă stepwise 


Rezumat 

* Regresia multiplă stepwise este o modalitate de alegere a predictorilor unei 
anumite variabile dependente pe baza criteriilor statistice. 

hi Practic, procedura statistică hotărăşte care variabilă independentă reprezintă 
cel mai bun predictor, al doilea ca valoare etc. 
m Se pune accentul pe identificarea celor mai buni predictori pentru fiecare etapă. 
Când predictorii se află într-o relaţie strânsă de corelaţie atât între ei, cât şi cu 
variabila dependentă, adeseori, o variabilă ajunge să fie enumerată ca fiind 
predictor, iar cealaltă nu. Acest lucru nu înseamnă că a doua variabilă nu 
constituie un predictor, ci doar că nu adaugă nici o informaţie în plus predicţiei 
faţă de cele oferite de primul predictor. Uneori, cei mai bun predictor este doar 
cu puţin mai bun decât al doilea în ordinea valorii şi unele variaţii minore la 
nivelul procedurilor pot afecta alegerea unuia dintre cei doi drept predictor. 

* Există o serie de variante de regresie multiplă. Metoda stepwise este, de obicei, 
o alegere bună, deşi se pot introduc© toate variabilele simultan ca soluţie 
alternativă. în acelaşi mod, puteţi să introduceţi toate variabilele simultan şi să 
eliminaţi treptat predictorii unul câte unul, dacă această eliminare influenţează 
într-o măsură foarte redusă predicţia în ansamblu. 

» Puteţi, de asemenea, să introduceţi variabilele sub formă de grupuri diferite 
pentru analiză. Acest procedeu se numeşte regresie multiplă ierarhică şi poate 
fi, de pildă, ales împreună cu procedurile stepwise, Metoda folosirii grupărilor 
este tratată în capitolul următor. 

Procesarea unei analize prin regresie multiplă stepwise este exemplificată folosind 
datele prezentate în tabelul 28.1, care reprezintă scorurile înregistrate de şase indivizi 
referitor la cele patru variabile ale reuşitei educaţionale, a capacităţii intelectuale, a 
motivării şcolare şi, respectiv, a interesului parental. 

Având în vedere că această analiză are scop ilustrativ şi din dorinţa de a economisi 
spaţiu, vom introduce aceste date de 20 de ori, pentru a avea o cantitate considerabilă de 
informaţii de lucru. în mod evident, acest lucru nu se face dacă datele sunt reale. Este 
important să folosiţi un număr cât mai mare de participanţi sau de cazuri pentru cercetarea 
realizată prin regresie multiplă. Un număr de variabile de zece sau cincisprezece ori mai 
mare decât cel din exemplul nostru ar reprezenta o cantitate rezonabilă. Desigur, puteţi 
folosi un număr mai mic de participanţi atunci când obiectivul dumneavoastră este 
explorarea datelor. 


Tabelul 28.1. Date pentru regresia multiplă stepwise 



1 28.1. Analiza prin regresie multiplă stepwise 
(selecţia pas cu pas) 






Pasul 1 


Introduceţi datele. 
Variabila „Freq" este 
folosită pentru 
ponderarea acestor şase 
cazuri de 20 de ori 
folosind procedura 
„Weight Cases...". 

Salvaţi acest fişier cu 
date pentru a-i folosi în 
capitolul 29. 


pl 

Achievemerit 

Abilitv:* 

'Motivatibh. 



S 


1 

2 

1 


20 



2 

2 

3 

i 

20 


ii 

2 

2 

3 

3 

20 


a 

3 

4 

3 

2 

20 


m 

3 

3 

4 

3 

20 


m 

4 

3 

2 

2 

20 


’£Jm 




























lini- .ir Reyrossion 




WjwîŞîj 

âtrtwW*! 


ţjŞgjtg 


i Mi 


•.<&* ■>--■ 


corec 

ta 

t. (Majoritatt 

cimlimpîifar 

SuulSl 

dse, fi 

ic 

tet 

huuiuuwiiitu 

:are nou pas 


REGRESIA multiplă stepwise 


201 


«te bine atSm^dell “ *' d ° Uea ~ ” Mo£ivat ™” în ge-e-al 

Observaţi câ. de rău cu «“«toi mai mare. " J ' 

clic pe un tabel, acesta va fi Încadrat Înfi'-mî*che^' “ D mod spedal - Daoă da î f dubiu 
înTă P ™ lului ’ muta ^ cursorul la rândul respectiv An depIasa 0rice ^nd în 

LdT‘ ă duWă ( *»’ ** °«« 8t 4™ si dneti bL„? C1 Ci ” d CUrsomI se ‘ransfbnnâ 
ccndul pană când acesta ajunge în LL-' dn r «". mouse - ului a Ptot, deplasând 

trageţ, astfel de marginile coloanelor ar trebui «â L*" 3 ™ 6 ^ “' 1 elibera - Dacă 
“«or de ciut. r ' treDui s5 obţineţi un tabel mai bun si mai 

Variaţia» Entero<l/R emoVBd . 



a. Variabila dependentă: Reuşita 

T valorik * “***. ** * 

de corelaţie multiplă dintre modele si critek D ’ P ‘' “ tebel al «^oientUor 

oare tnd.câ îmbunătăţirea corelaţieiconţine şi;statistici 
exemplu oferă o îmbunătăţire a corelaţiei Ar- ^ §1 date ' Flecare model din acest 
la nivelul cărora schimbarea corelaţiei este f P ° 3te observa din valorile finale 
f H » ocl al modelului 2 2 “" Semn ! flcativă atât în ca^l modeiuM 
de-al patrulea Uibel al oumuuu"^!" ~ B * - pot fi găsite îr , iî 











202 


INTRODUCERE ÎN SPSS PENTRU PSIHOLOGIE 



Cel mai important lucru este faptul că valoarea „Sig. F Change" 
{valoarea corectată Fa semnificaţiei statisticii) indică faptul că 
îmbunătăţirea potrivirii dintre cele două modele este semnificativă. 


■ Predictorul introdus în primul pas al analizei stepwise (modelul 1) este cel care are 
cea mai mare corelaţie cu respectivul criteriu. în acest exemplu, predictorul este 
„Abiiity”. (Observaţi că litera „a” situată imediat sub tabelul „Model Summary” 
indică acest lucru.) 

* Din moment ce în prima etapă există un singur predictor în ecuaţia de regresie, 
valoarea R multiplu coincide cu aceea a corelaţiei dintre „Abiiity” şi „Achievement” 
(variabila dependentă sau criteriu). în acest caz, valoarea ei este de 0,701 sau 0,70 
dacă o reducem la o precizie de două zecimale. 

® Valoarea R 2 reprezintă coeficientul de corelaţie multiplă la pătrat, care, în acest 
exemplu, are valoarea de 0,491 sau 0,49 dacă o reducem la două zecimale. Această 
cifră indică faptul că varianţa criteriului este comună cu sau „explicată de” primul 
predictor în proporţie de 49%. 

® Valoarea R 2 ajustată porneşte de la valoarea R 2 care a fost ajustată pentru a se potrivi 
dimensiunii eşantionului şi numărului de predictori din ecuaţie. Efectul acestei ajustări 
este reducerea valorii R 2 , astfel încât R 2 este 0,487 sau 0,49 dacă ne limităm la o 
precizie de două zecimale. 

® A doua variabilă introdusă în ecuaţia de regresie este predictorul care explică, în 
general, a doua proporţie semnificativă ca mărime a varianţei criteriului. în acest 
exemplu, această variabilă este „Motivation”. 

® Valorile R multiplu, R 2 şi R 2 ajustat pentru modelul 2 sunt 0,718, 0,515 şi, respectiv, 
0,507, care, rotunjite la două zecimale, devin 0,72, 0,52 şi 0,51. După cum era de 
aşteptat, aceste valori sunt mai mari decât cele din modelul 1. Acest lucru este 
previzibil din cauza existenţei unui predictor suplimentar care contribuie la îmbună¬ 
tăţirea predicţiei. 

ffl în Modelul 2, aşadar, există două variabile („Abiiity” şi „Motivation”) care explică 
sau justifică în proporţie de 51 % varianţa criteriului. 

ta Valoarea R 2 corectat prezentată în secţiunea „Change Statistics” din al doilea tabel 
prezintă creşterea proporţiei de varianţă la nivelul variabilei criteriu („Achievement”) 
proporţional cu predictorii care au fost introduşi după primul predictor („Abiiity”), 
în acest caz, există un singur predictor („Motivation”). Acesta justifică o proporţie 
suplimentară de 2,4% din varianţa criteriului. 

Sî Analizaţi tabelul intitulat „Coefficients”. Uitaţi-vă în coloana intitulată „Seta”, Prima 
valoare este de 0,701, pentru modelul 1. Este exact aceeaşi valoare cu. aceea a 
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corelaţiei multiple din modelul i de mai sus. Acest lucru se întâmplă deoarece 
valoarea beta este coeficientul de regresie standardizat, care are aceeaşi valoare ca şi 
corelaţia atunci când există un singur predictor. Este ca şi cum toate scorurile pe care 
le aveţi s-ar transforma în scoruri z înainte de începerea analizei. 


Coefficients 0 



Cea mai rapidă modalitate de accesare a output-ului regresiei multiple constă în a 
vă concentra asupra output-ului modelului final din tabel, cel etichetat „Coefficients". 
Ignoraţi rândul dedicat valorilor constante şi concentraţi-vă asupra restului 
rândurilor. Acestea conţin predictorii importanţi ai variabilei dependente, care sunt, 
în mod evident, „Abiiity 11 şi „Motivation", ambele elemente având o contribuţie 
semnificativă. 


Scorurile coeficienţilor B sunt greu de interpretat deoarece depind de scara de 
măsură folosită. Valorile beta sunt analoge coeficienţilor de corelaţie. Ambele valori 
beta sunt pozitive, ceea ce înseamnă că există o relaţie pozitivă între fiecare predictor 
şi variabila dependentă. Abilitatea are o corelaţie de 0,649 cu Achievement", iar 
„Motivation" contribuie cu o corelaţie independentă suplimentară de 0,164 cu 
„Achievement”. 


Valorile /, plus valorile „Sig.” corespunzătoare acestora, indică o contribuţie 
semnificativă la predicţie din partea celor două variabile independente. 


* Valoarea Beta este de 0,649 pentru primul predictor („Abiiity”) şi de 0,164 pentru 
cel de-al doilea („Motivation”). 

■ Analiza se opreşte în acest punct, din moment ce al treilea predictor („Interest”) nu 
mai explică o proporţie semnificativă a varianţei criteriului. Observaţi că în tabelul 
final al output-ului intitulat „Excluded Variables”, „Interest” are o valoare t de 0,000 
şi un nivel de semnificaţie de 1,0000. Acest lucru ne indică faptul că „Interest” este 
un predictor nesemnificativ al criteriului („Achievement”). 


28.3. Raportarea output-ului 

® Există numeroase modalităţi de raportare a rezultatelor unei analize prin regresie multiplă 
stepwise. într-un astfel de raport trebuie să includem o afirmaţie asemănătoare cu 
următoarea: „în cadrul regresiei multiple stepwise, am introdus mai întâi capacitatea 
intelectuală care a explicat 49% din varianţa reuşitei educaţionale (F, u7 = 5,85, 
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p = 0,017). Performanţa educaţională deosebită a fost asociată unei capacităţi 
intelectuale ridicate şi motivaţiei şcolare”. 

n Uneori se prezintă şi un tabel. Nu există o metodă standard de a face acest lucru, dar 
tabelul 28.2 este probabil la fel de clar ca majoritatea tabelelor de acest gen. 


Tabelul 28.2. Regresia multiplă stepwise a predictorilor reuşitei educaţionale 
(sunt incluşi doar predictorii semnificativi) 


Rezumat 


a Regresia multiplă ierarhică îi permite cercetătorului să decidă în ce ordine să 
folosească o listă de predictori. 

* Acest lucru se realizează prin asocierea predictorilor sau a grupurilor de pre- 
dictori în blocuri de variabile. Computerul va efectua regresia luând fiecare bloc, 
în ordinea în care a fost introdus în aplicaţia SPSS. Aşadar, această procedură 
constituie o metodă care obligă la analizarea variabilelor în ordinea aleasă de 
cercetător. în loc să lase computerul să decidă asupra criteriilor statistice, aşa 
cum a făcut în capitolul anterior, cercetătorul hotărăşte el însuşi care ar trebui 
să fie primul predictor, al doilea şi aşa mai departe. 

■ Un bloc poate fi format dintr-un singur predictor sau dintr-un grup de predictori. 
Ordinea în care sunt situate variabilele în bloc nu contează, din moment ce 
acestea sunt tratate împreună ca grup. 

■ Este foarte probabil ca această ordine a blocurilor să fie aleasă din motive 
teoretice. Una dintre procedurile obişnuite constă în a situa în primul bloc 
variabilele care trebuie controlate din punct de vedere statistic. Consecinţa 
acestei decizii este faptul că variabilele de control sunt parţiaiizate înainte ca 
restul blocurilor să fie analizate. 

* Din momentul în care cercetătorul încearcă să obţină modele de informaţii, regresia 
multiplă poate fi variată pentru a exemplifica, de pildă, efectele introducerii 
blocurilor în altă ordine. 

* Regresia multiplă ierarhică se foioseşte pentru calcularea coeficienţilor de 
corelaţie într-o analiză simplă a parcursului critic. 

Procesarea unei analize prin intermediul regresiei multiple ierarhice este ilustrată 
folosind datele prezentate în tabelul 29.1, care reprezintă scorurile înregistrate în cazul 
a şase indivizi referitor la cele patru variabile: reuşita şcolară, capacitatea intelectuală, 
motivaţia şcolară şi interesul parental. 

Am adăugat o variabilă suplimentară, clasa socială, care se măsoară pe o scară de la 
1 la 5, 5 fiind cea mai înaltă clasă socială. Analiza ierarhică se foloseşte atunci când 
variabilele sunt introduse într-o ordine predeterminată de către cercetător, bazată pe 
motive „teoretice” şi nu pe baza criteriilor statistice. Acest lucru se realizează prin 
ordonarea variabilelor independente în blocuri de variabile, numite „Block 1”, „Block 2” 
etc. Un bloc poate fi alcătuit dintr-o singură variabilă independentă sau din mai multe. 
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Tabelul 29.1. Date pentru regresia multiplă ierarhică 


In această analiză, vom situa în „Block 1” variabila clasei sociale („Class”), care f 
este, practic, o variabilă demografică pe care dorim să o controlăm. „Block 2” va fi 
alcătuit din capacitatea intelectuală („Ability”). „Block 3” va fi format din motivaţia şcolară 
(„Motivation”) şi interesul parental („Interest”). Variabila dependentă sau criteriul pe 
care vrem să-l explicăm este reuşita şcolară („Achievement”). f 

Practic, modelul din exemplul nostru afirmă că reuşita şcolară este afectată de 
capacitatea intelectuală, care este determinată în parte de factorii motivaţionali cum ar fi I 
motivaţia şcolară sau interesul parental. Clasa socială este variabila pe care o controlăm 
Î8 acest moto! din moment ce nu o considerăm a fi un factor psihologic. | 

Atunci când efectuăm o analiză a parcursului critic, est® adeseori necesar să realizăm | 
mai multe regresii multiple ierarhice. Acestea trebuie repetate folosindu-se blocuri diferite 
în ordine diferită, astfel încât diferitele modele de relaţii reciproce dintre acestea să 
poată fi cercetate. | 


29.1. Analiza prin regresie multiplă ierarhică 


Pasul 1 

Selectaţi fişierul de date dacă 
l-aţi salvat. Dacă nu, introduceţi' 
datele. O a cincea variabilă, 
„Class', a fost introdusă în cea • 
de-a şasea coioană. 


liAbtliiy-, 

2 

Motivation 

1 

■S-IntarisfĂ 
2_ 
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2 _ 
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20 
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3 

3 

20 

i 

3 

2 

20 

3 

4 

3 

20 

_3__ 

2 

2 

20 


Pasul 2 

Selectaţi „Anaîyze", 
„Regression" 
şi „Linear...". \ 


•ji'.Freq "•'•I 

!'-.Class T 

1 20 

2 

f§ 20 

-i|. 



Limwr Rcyrciuuri 


Linear Rcyres&ion 
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Pasul 3 


Selectaţi „Achievement” şi - 
apăsaţi butonul ► de lângă 
caseta „Dependent:" pentru 
a introduce variabila în 
casetă. 

Selectaţi „Class" şi apăsaţi 
butonul < de lângă caseta 
„Independentţs):” pentru a 
introduce variabila în 
casetă. 

Selectaţi „Nexf. 


Pasul 4 

Selectaţi Ability" şi 
apăsaţi butonul < de 
lângă caseta 
„Independent(s):” pentn 
a introduce variabila în 
casetă. 

Observaţi că acesta 
este „Block 2 of 2". 

Selectaţi „Next". ——.__ 


| Ab&y 


•Q Motivation 
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Pasul 5 



Selectaţi „Motivation" ş 
„InteresC şi apăsaţi 
butonul < de lângă 
caseta „Independent^; 
pentru a introduce 
variabilele în casetă, • 


Selectaţi „Statistics...". 



29.2. Interpretarea output-ului 

* După cum se axată în al doilea tabel al output-ului intitulat „Model Suimna^", 
variabila introdusă în primul bloc este „Clas.”. Valoarea pentru acest bloc este 
practic, 0,0 (0,004), ceea ce înseamnă că variabila clasei sociale justifica m P P 
de 0% varianţa reuşitei educaţionale. 

m Semnificaţia statistică a lui F-change cu valoarea de 0,497 pentru acest bloc saui model 
are semnificaţia de 0,482. Din moment ce această valoare este mai mare decât vidoar 
critică de 0,05, aceasta înseamnă că ecuaţia de regresie din această primă etapă nu 
explică intr-o proporţie semnificativă varianţa variabilei reuşita educaţională/şcolară. 
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Mqatoî SumiMMy 


Model 



Adjusted 

R Square 

Std. Errof of 
mă Estimata 


Cbange Stat 

stics 


R 

R Square 

R Square 
Chanţje 

F Change 

d f1 

df2 

Slg. F Change 

1 

.066* 

.004 

-.004 

,§63 

.004 

.497 

i 

118 

.482 

2 

.714° 

.509 

.501 

.679 

.505 

120.333 

i 

117 

.000 

3 

.769* 

.591 

.577 

.626 

.082 

11.500 

2 

115 

.000 


a. Predictors: (Constant), Clasa. 

b. Predictors: (Constant), Clasa, Ability. 

c. Predictors: (Constant), Clasa, Ability, Motivation, interest. 


■ Variabila introdusă în cel de-al doilea bloc este „Ability”. Valoarea R 2 ajustat pentru 
acest bloc sau model este de 0,501, ceea ce înseamnă că variabila capacitate intelectuală, 
împreună cu cea a clasei sociale, justifică în proporţie de 50,1% varianţa reuşitei 
educaţionale (şcolară). 

a Semnificaţia statistică a Raportului F pentru acest bloc este de 0,000, ceea ce înseamnă 
că este mai mică decât 0,001. Din moment ce această valoare este mult mai mică 
decât valoarea critică de 0,05, vom trage concluzia că primii doi paşi ai ecuaţiei de 
regresie explică intr-o proporţie semnificativă varianţa reuşitei educaţionale. 

■ Variabilele introduse în cel de-al treilea şi ultimul bloc sunt „Motivation” şi „Interest”. 
Valoarea R 2 ajustat pentru acest bloc este de 0,557, ceea ce înseamnă că toate cele 
patru variabile justifică în proporţie de 55,7% varianţa reuşitei educaţionale. 

* Raportul F pentru acest bloc este de 0,000. Din moment ce această valoare este mult 
mai mică decât valoarea critică de 0,05, înseamnă că primii trei paşi ai ecuaţiei de 
regresie justifică într-o proporţie semnificativă varianţa reuşitei educaţionale. 

* Cea mai simplă interpretare a output-ului se poate realiza prin examinarea celui de-al 
patrulea tabel al output-ului, intitulat „Coefficients”. Coloanele „Beta” şi „Sig.” 
(ale valorii t ) sunt deosebit de utile. Acestea ne comunică faptul că valoarea 
corelaţiei (beta) dintre variabilele „Class” şi „Achievemcnt” este -0,439 atunci când 
sunt luaţi în considerare ceilalţi prcdictori. Această corelaţie este semnificativă la 
nivel de 0,000, ceea ce înseamnă mai puţin de 0,001. Acest coeficient este semni¬ 
ficativ acum pentru că variabilele „Ability” şi „Interest” suprimă coeficientul de 
ordin zero dintre „Class” şi „Achievement”. în condiţiile în care controlăm variabila 
clasei sociale în blocul 1, corelaţia dintre „Ability” şi „Achievement” este de 0,730. 
Această valoare este semnificativă la nivel de 0,000. în cele din urmă, în condiţiile 
în care controlăm variabilele „Class” şi „Ability”, corelaţiile pentru fiecare dintre 
variabilele din blocul 3 (motivaţia şcolară şi interesul parental) şi reuşita educaţională 
(„Achievement”) sunt date separat. 
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Coofflclents* 



Cea mal rapidă modalitate de accesare a ouţput-ului este de a vă concentra 
asupra celui de-al treilea model din datele de mai sus, Output-ul vă indică faptul 
că atunci când toate variabilele „Class", „Abllity’, „Motivation" şi „Interest" sunt 
introduse, există o asociere semnificativă între fiecare dintre ele şi variabila 
dependentă „Achievement". Clasa socială are o relaţie negativă, în timp ce restul 
variabilelor au o relaţie pozitivă. 


29.3. Raportarea output-uiui 

* Există diferite moduri de raportare a rezultatelor analizei prin regresie multiplă 
ierarhică. într-un astfel de raport, de obicei se descriu procentele de varianţă, 
explicate de fiecare set sau bloc de predictori (după valoarea R 2 ). 

® O modalitate de raportare a acestor rezultate ar fi următoarea: „într-o regresie 
multiplă ierarhică, predictorii potenţiali ai reuşitei au fost asociaţi în blocuri. Clasa 
socială a fost introdusă prima, apoi capacitatea intelectuală a fost adăugată în al 
doilea bloc, iar motivaţia şcolară şi interesul parental au fost adăugate în ultimul bloc. 
Modelul final a indicat faptul că variabila clasei sociale este un predictor negativ 
(B = - 0,31), capacitatea intelectuală unul pozitiv (B = 0,94), iar motivaţia şcolară 
şi interesul parental sunt şi ei predictori pozitivi (B = 0,19 şi 0,44). Toţi predictorii 
au fost semnificativi Ia nivel de 1 % 

■ De asemenea, trebuie rezumată şi ecuaţia de regresie, ca în tabelul 29.2. 
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Tabelul 29.2. Regmia multiplă ierarhică a predictorilor reuşitei educaţionale 



* Semnificativ la nivel de 0,01. 
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Analiza validităţii itemilor 
şi acordul intereva luare 


Rezumat 

s Validitatea este o chestiune complexă, deoarece acest termen se referă la o 
gamă de concepte şi măsuri foarte diferite. Este uşor sâ le încurci între ele. 

* Coeficientul aipha de validitate a itemilor şi metoda split-half evaluează consistenţa 
internă a itemilor unui chestionar — adioă, felul în care itemii tind să măsoare 
acelaşi lucru. 

■ Metoda split-half pentru studiul validităţii testului din aplicaţia SPSS se referă la 
corelaţia dintre scorurile obţinute pe baza primei jumătăţi de itemi incluşi în 
chestionar şi cele obţinute pe baza celei de-a doua jumătăţi a itemilor chestiona¬ 
rului. Această corelaţie poate fi ajustată statistic pentru a se menţine lungimea 
chestionarului iniţial. 

m Coeficientul aipha nu este altceva decât o medie a tuturor fidelităţilor chestiona¬ 
rului obţinute prin metoda split-half pentru un chestionar şi de aceea ar putea fi 
de preferat, din moment ce nu depinde de ordinea itemilor în chestionar. 
Coeficientul aipha poate fi folosit ca modalitate de scurtare a chestionarului, 
menţinând sau îmbunătăţind în acelaşi timp validitatea sa internă. 

as Acordul interevaluare (măsurată aici de coeficientul kappa) este, practic, o 
măsură a concordanţei dintre aprecierile a doi evaluatori diferiţi. Aşadar, această 
metodă este deosebit de folositoare pentru evaluarea codificărilor sau aprecierilor 
efectuate de către „experţi” ale informaţiilor obţinute pe baza întrebărilor deschise; 
cu alte cuvinte, se referă la cuantificarea datelor calitative. Acest procedeu implică 
măsura în care cei doi evaluatori au fost întru totul de acord asupra evaluărilor 
lor, în comparaţie cu acordul prevăzut de probabilitate. Observaţi că acest 
aspect este diferit de corelaţia dintre evaluatori care nu necesită un acord 
perfect pentru atingerea unui nivel ridicat al corelaţiei, ci doar o creştere relativă 
a evaluărilor în cazul ambilor evaluatori. 

b Alte forme de validitate, cum ar fi consistenţa unei măsuri luate în două momente 
diferite (fidelitatea test-retest), pot fi evaluate prin simpla folosire a coeficientului 
de corelaţie (capitolul 7). 


30.1. Coeficientul aipha de validitate a itemilor 

Răspunsurile date de zece persoane referitor la cei patru itemi ai unui chestionar sunt 
ilustrate în tabelul 30.1. Aceste informaţii vor fi folosite pentru ilustrarea a două metode 
de stabilire a fidelităţii itemilor, cunoscute sub numele de coeficientul aipha de fidelitate 
şi metoda split-half. 



Tabelul 30.1. Informaţii referitoare la 10 cazuri, 
pe baza unui chestionar cu patru itemi 



Pasul 1 

Introduceţi datele. 
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Pasul 2 



Selectaţi „Analyze", 
„Scale" şi 

„Reliability Analysis...”, 










: ftetlability Artalysis 


aişiiM 


t >■ . ■ » 


100.0 
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Al doilea tabel reprezintă coeficientul alpha de 
validitate a celor patru itemi şi are valoarea de 
0,811, valoare care se rotunjeşte la un număr cu 
două zecimale egal cu 0,81. 


Bellabllity Statlstics 


Cronbach's 

Alpha 

N of Items 

** .811 

4 


Item-Tota! Statlstics 



Scale Mean If 
Item Deleted 

Scale 
Vanance if 
Item Deleted 

Corrected 

Item-Total 

Correlation 

Cronbach's 
Alpha if Item 
Deleled 

Item 1 

7.60 

18.933 

.490 

.840^ 

Item 2 

8.00 

19.556 

.718 

.731 

Hem 3 

7.70 

17.789 

.842 

.671 

Item 4 

7,90 

18.767 

.547 

.806 


Acesta este coeficientul alpha de 
validitate a unei scale din care a fost 
eliminat unul dintre itemi. Din această 
coloană putem vedea că, dacă 
îndepărtăm primul item („Item 1"), 
coeficientul alpha de validitate al 
celor trei itemi ai scalei care rămân 
creşte uşor de la 0,811 la 0,840. 

Din moment ce aceasta este o 


schimbare foarte mică, probabil că 
este mai bine să păstrăm şi itemul 1. 


30.3. Raportarea output-ului 

O modalitate de raportare a rezultatelor acestei analize ar fi următoarea: „Coeficientul 
alpha de validitate a scalei cu patru itemi are valoarea de 0,81, ceea ce demonstrază că 
scala are un nivel bun de fidelitate”. Un coeficient alpha cu o valoare mai mare sau egală 
cu 0,80 este considerat satisfăcător. 


30.4. Metoda split-half 


Datele prezentate mai sus sunt folosite din nou şi pentru această analiză. 



Apăsaţi pe butonul ▼ din 
fereastra „Model:" şi ale¬ 
geţi opţiunea „Spllt-half". 


Apăsaţi „OK". 


{Dacă doriţi, 
deselecta 
„Scale if item deleted" 
din meniul 
„Statistics...”.) 


:l 
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30.5. Interpretarea output-ului 


Ultimul rând din al doilea tabel ilustrează coeficientul de validitate obţinut prin testul 
Guttman în cazul celor patru itemi ca având valoarea de 0,646, care se rotunjeşte 
număr cu două zecimale egal cu 0,65. 


Reliability Statistic» 


Cronbach's Alpha Part 1 


Value 
N of Items 
Value 
N of Items 


Total N of Items 
Correlation Between Forms 

Spearman-Brown Equal Length 

Coefficient Unequal Length 

Guttman Spiit-Half Coefficient 

a. Itemii sunt: itemul 1, itemul 2. 

b. Itemii sunt: itemul 3, itemul 4. 


30.6. Raportarea output-ului 


o modalitate de raportare a rezultatelor acestei analize ar fi următoarea: „Coeficientul 
de fidelitate obţinut prin metoda split-half în cazul scalei cu patru itemi este de 0,65, 
ceea ce indică faptul că fidelitatea scalei este una moderată”. 


30.7. Corelaţia intraclasă 

(coeficientul de concordanţă kappa) 

Coeficientul kappa este folosit pentru măsurarea concordanţei dintre doi evaluatori, 
având în vedere acordul estimat prin probabilitate. Vom ilustra calcularea acestui 
coeficient folosind datele din tabelul 30.2, care coniine aprecierile KcuU, de un psAolog 
criminalist şi de un psihiatru asupra a 12 persoane vinovate de “ f 
evaluând măsura în care acestea nu reprezintă pentru public nici un risc (1), constituie 

un risc moderat (2) sau un risc mare (3). 



.'e.?c.npţiye.St^ţJ5t«c^, * 




Pasul 1 

Introduceţi datele. 


Pasul 2 

Selectaţi „Anaiyze", 
„Descriptive Statistics 
şi „Crosstabs...". 


ALIZA VALIDITĂŢII ITEMII,OR ŞI ACORDUL INTEREVALUARE 


faoelul 30.2. Evaluările riscului prezentat de 12 infractori, 
efectuate de către doi specialişti 
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Selectaţi „Psychologist" - 
şi apăsaţi butonul ► de 
lângă caseta „Row(s):" 
pentru a introduce 
informaţia în casetă. 

Selectaţi „Psychiatrist" şi 
apăsaţi butonul ◄ de 
lângă caseta „Column(s):" 
pentru a introduce 
informaţia în casetă. 

Selectaţi „Statistics...”. N 


<$> Psychologist 


’iîu»'. l'Wj 


Selectaţi „Kappa”. \ 

Selectaţi .Continue".. ' 

Apăsaţi „OK" > 

în ecranul anterior, care 
va reapărea. 
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30.8. Interpretarea output-ului j 


în al doilea tabel al output-ului, 
informaţiile au fost aranjate într-un 
format 2x2. Numărul de cazuri 
asupra cărora psihologul 
criminalist şl psihiatru! sunt de 
aceeaşi părere sunt ilustrate în 
celule de pe diagonala acestui 
tabel. Aceste valori sunt 1 pentru 
evaluarea t, 0 pentru evaluarea 2 
şi 8 pentru evaluarea 3. 


Psychologist * Psychiatrist Crosstabulatlon 

Count 



Psychiatrist 

Total 

1 

2 

3 

Psychologist 1 



0 

2 

2 

0 

S «N S ^0 


2 

3 

0 

cH 

—-jh 

8 

Total 

1 

i 

10 

12 



în al treilea tabel, kappa apare ca având valoarea 
de 0,400. Deşi coeficientul kappa are o semnificaţie 
statistică p = 0,046, această valoare indică doar un 
nivel moderat de acord. 


Symmetrlc Measures 




Measure of Agreement Kappa 
N of Valid Cases 


a. Neluând în considerare ipoteza nulă. 

b. Folosind eroarea standard asimptotică, luând în cosiderare ipoteza nulă. 



Observaţi că valoarea kappa le permite evaluatorilor să folosească aceeaşi evaluare de 
mai multe ori. Aceasta nu reprezintă o măsură a proporţiei corelaţiei dintre cei doi. 

30.9. Raportarea output-ului 

O modalitate de raportare a rezultatelor acestei analize ar fi următoarea: „Coeficientul 
kappa al corelaţiei dintre evaluările pshiloguîui criminalist şi ale psihiatrului a fost de 0,40, 
ceea ce indică o valoare moderată a corelaţiei”. 














Analiza logliniară 


Rezumat 

s Analiza logliniară se folosşte pentru analizarea tabelelor de contingenţă care 
conţin trei sau mai multe variabile. Aşadar, poate fi considerata a fi o continuare 

a Testului chi-square discutat în capitolul 14. 

m Scopul acestei analize este aceia de a determina care dintre variabile şi inter¬ 
acţiunile acestora explică (sau redau) cel mai bine frecvenţele observate din 
tabel. Variabilele şi interacţiunile acestora considerate pe cont propriu sau in 
combinaţie sunt cunoscute sub numele de modele. 
h Statisticile efectuate prin teste de tipul goodness-of- fit sunt folosite pentru evaluarea 
gradului de corespondenţă dintre model şi date. Semnificaţia statistica indica faptul 
că modelul care este examinat nu reuşeşte să justifice în totalitate frecvenţele 
observate. Lipsa semnificaţiei statistice înseamnă că modelul care este analizat 
se potriveşte cu frecvenţele observate. Dacă există mai mult de un model care 
se potriveşte cu datele, modelul care are cele mai puţine variabile şi interacţiuni 
este considerat a fi cel mai simplu şi, de aceea, poate fi modelul P ref ® r ^- 
Raportul de probabilitate chi-square este folosit ca metoda statistica de testare. 

Procesarea unei analize logliniare este exemplificată folosind datele din tabelul 31.1. 
Acest tabel conţine informaţii referitoare la frecvenţa abuzului sexual şt fizic, m cazul unor 
pacienţi cu afecţiuni psihice, dintre care 140 sunt femei, iar 160 - bărbaţi. Pentru analizarea 
unui tabel cu date ca acesta cu ajutorul aplicaţiei SPSS, mai întâi trebuie să introducem datele 
în „Data Editor” şi să ponderăm celulele după frecvenţele cazurilor pe care le conţin. 

Tabelul 31.1. O contingenţă 3-way care ilustrează relaţia dintre sex, abuz sexual şi abuz 
fizic, în cazul unui eşantion de pacienţi ai unui spital psihiatric 
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31.1, Ar sriza logliniară 


Pasul 1 

Introduceţi datele. 
Ponderaţi cazurile 
după valoarea 
„Freq.". 


Pasul 2 

Selectaţi „Analyze’ 
„Logfinear" şi 
„Model Selection.., 


Pasul 3 

Selectaţi separat sau împreună 

factorii „Sexual”, „Physical” şi _ 

„Sex" şi apăsaţi butonul < de 
lângă caseta „Factor(s):" pentru a 
introduce elementele în casetă. 

Selectaţi „Define Range”. Din 
moment ce toate cele trei 
variabile au aceiaşi interval, 
acesta poate fi definit odată 
pentru toate. 


v.\ 




_:t-' ? 




1 

2 

30 

P| 

1 

2 

i 

40 

m i 

2 

2 

25 


2 

1 

1 

35 

m 2 

1 

2 

55 

m 2 

2 

1 

45 

§8 2 

2 

2 

50 
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Pasul 4 

Scrieţi .1" în caseta „Minimum:". 
Scrieţi X în caseta „Maximum:" 

Selectaţi „Continue". 

Apăsaţi „OK” în ecranul 
anterior, care va reapărea. 


31.2. Interpretarea output-ului 

Pentru a desfăşura output-ul complet prezentat mai jos, daţi clic în fereastra „Viewer” 
care creează un cadru în jurul output-ului. Săgeata îndreptată în jos, spre colţul din 
stânga jos al output-ului, indică faptul că mai aveţi de văzut o parte din output. Aşezaţi 
cursorul pe micul pătrat din centrul liniei din josul paginii şi trageţi această linie în jos 
până când se afişează tot output-ul. 

Daţi clic în output 
îndepărtându-vă de 
margini, pentru a forma 
conturul. 


Deplasaţi cursorul aici, daţi clic şi trageţi linia 
în jos până când ajungeţi la finalul 
output-ului. Aveţi nevoie de oarecare exerciţiu 
pentru a face acest lucru. 

Output-ul extins este prezentat dacă faceţi acest lucru. De cele mai multe ori, este mai 
bine să-l ignoraţi. Modelul final este cel mai important. 

*********** HIERARCHÎCAL LOG LINEAR *********** 

DATA Information 

8 unweighted cases accepted. 

0 cases rejected because of out-of-range factor values. 

0 cases rejected because of mi9sing data. 

300 weighted cases will be used in the analysis. 

FACTOR Information 
Factor Level Labei 

SEXUAL 2 Sexual abuse 

PHYSICAL 2 Physical abuse 

SEX 2 Sex 

ooet-ftooHIERARCHÎCAL LOG LINEAR *********** 
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DESIGN 1 has generating class 
SEXUAL*PHYSICAL’SEX 

Notei For saturated modela .500 ha8 been added to all observed 
cells. 

This value may be changed by using the CRITERIA = DELTA subcomttiand. 
The Iterative Proporţional Fit algorithm converged at iteration 1. 

The maximum difference between observed and fitted marginal totals is 
.000 and the convergence criterion is .250 


Observed, Expected Frequencies and Residuals. 

Factor Code OBS count EXP count 

SEXUAL Sexually 

PHYSICAL Physical 

SEX Females 20.5 20.5 

SEX Males 30.5 30.5 

PHYSICAL Not phys 

SEX Females 40.5 40.5 

SEX Males 25.5 25.5 

SEXUAL Not sexu 

PHYSICAL Physical 

SEX Females 35.5 35.5 

SEX Males 55.5 55.5 

PHYSICAL Not phys 

SEX Females 45.5 45.5 

SEX Males 50.5 50.5 


Residual 


Std Resid 


Goodness-of-fit test statistics 
Likelihood ratio chi square = 
Pearson chi square ■= 


P a 1.000 
p * 1.000 




HIERARCHÎCAL LOG LINEAR 




L.R. Chisq 
1.185 
9.680 

28.834 

Prob 

.2764 

.0462 

.0002 

Pearson Chisq 
1.181 

„ 10.013 

28.000 

Prob 

.2772 

.0402 

.0002 

effects are 
L.R. Chisq 

zero. 

Prob 

pearson Chisq 

Prob 

19.154 

.0003 

17.987 

.0004 

8.495 

.0368 

8.833 

.0316 

1,185 

.2764 

1.181 

.2772 


Iteration 

3 

2 

0 


Iteration 

0 

0 . 

0 


*.**«*.*... HIERARCHÎCAL LOG LINEAR ********** 

Backward Elimination (p * .050) for DESIGN 1 with generating claas 
SEXUAL * PHYSICAL* SEX 


Likelihood ratio chi square 


p » 1.000 


.00000 


OF * 0 
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If Deleted Simple Effect is 'DF L.R. Chisq Change fiUU 
SEXUAL* PHY SICAL * SEX 1 1-185 * 2674 

Step 1 

The beat model has generating clasa 
S EXUAL * PH YSICAL 
SEXUAL*SEX 
PHYSICAL*SEX 

Likelihood ratio chi square = 1.18471 DF = 1 P = . 


If Deleted Simple Effect ia DF L.R. Chisq Change r 

SEXUAL*PHYSICAL*SEX 1 -454 -5 ° 85 

SEXUAL* SEX 1 1-963 

PHYSICAL*SEX 1 5.461 

Step 2 

The beat model has generating class *■ 

SEXUAL*SEX 
PHYSICAL*SEX 

Likelihood ratio chi square = 1.63849 DF = 2 P = .4 


If Deleted Simple Effect is DF L.R. i 
SEXUAL*SEX 1 

PHYSICAL*SEX 1 

************ HIERARCHICAL log linear **** 
Step 3 

The best model has generating class 
PHYSICAL'SEX 
SEXUAL 

Likelihood ratio chi square = 3.91036 


L.R. Chisq Change 
2.272 
5.770 


If Deleted Simple Effect is DF 
PHYSICAL*SEX 1 

cernit. 1 


L.R. Chisq Change 
5.770 
16.485 


Step 4 

The best model has generating class 
?HYSICAL*SEX 
SEXUAL 

Likelihood ratio chi square = 3.91036 


Prob Iter 
.0163 2 
.0000 2 


P = .271 
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'HIERARCHICAL LOG~rrnSAR * 
ie final model has generating clas: 

PHYSICAL’SEX 

"'-SEXUAL 


Acesta este modelul final. Mai jos sub: afi¬ 
şate frecvenţele pentru datele observate, 
iar dedesubt, cele pentru datele anticipate. 
Valorile reziduale reprezintă diferenţele 
dintre datele observate şi cele preconizate 
, de model. 


The Iterative Proporţional Fit algorithm cWrged at itezration oT 
The maximum difference between observed an/Eitted marginal totals is 
.000 and the convergence criterion is . 2 m 


Observed, 

Factor 

SEXUAL 

PHYSICAL 

SEX 

SEX 

PHYSICAL 

SEX 

SEX 

SEXUAL 

PHYSICAL 

SEX 

SEX 

PHYSICAL 

SEX 

SEX 


Expected Frequencies and 


Code 

OBS count 

EXP count 

Residual 

Std Resid 

Sexually 

Physical 

Pemales 

20.0 

21.1 

-1.08 

-.24 

Males 

Not phys 

30.0 

32.6 

-2.58 

-.45 

Females 

40.0 

32.6 

7.42 

1.30 

Males 

Not sexu 

25.0 

28.8 

-3.75 

-.70 

Physical 

Females 

35.0 

35.9 

1.08 

.19 

Males 

55.0 

52.4 

2,58 

.36 

Not phys 

Females 

45.0 

52.4 

-7.42 

-1.02 

Males 

50.0 

46.3 

3.75 

.55 


Goodneas-of-fit cest statistice “ 

Likelihood ratio chi square = 3.9 1036 DF = 3 

Pearson chi square = 3.95320 DF = 3 


P = . 2711 
P = .267 


" Au f° t st foIosJte două statistici pentru testarea gradului de corespondenţă a diferitelor 
modele. Acestea sunt Raportul de probabilitate chi-square şi Raportul chi-square Pearson 
Raportul de probabilitate chi-square este testul folosit cel mai des, deoarece are 
avantajul de a ft liniar, ceea ce permite adăugarea şi eliminarea unor valori chi-square 

■ Raportul de probabilitate chi-square pentru modelul saturat sau complet este primul 
prezentat şi valoarea sa este de 0,00000, care are o probabilitate de 1,000 Cu alte 
cuvinte, modelul saturat oferă o potrivire perfectă a frecvenţelor observate şi, în 
consecinţă, este nesemnificativ. Modelul saturat este format, în acest caz, din trei 
efecte principale, trei interacţiuni 2-way şi o interacţiune 3-way. în general,'modelul 
saturat conţine toate efectele principale şi interacţiunile. 

8 Totuşi ’ modeIul saturat conţine toate componentele, indiferent dacă acestea contribuie 
sau nu la explicarea variaţiei de la nivelul datelor observate. Aşadar, este necesară 
eliminarea componentelor pe rând, pentru a vedea dacă astfel se micşorează gradul 
de corespondenţă a modelului. Dacă se întâmplă acest lucru, componenta modelului 
se menţine în modelul final. 

* SPSS începe cu modelul complet şi elimină pe rând fiecare efect, pentru a determina 
care dintre efecte produce schimbarea cea mai puţin semnificativă la nivelul raportului 
de probabilitate chi-square. 
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® Modelul cu gradul cei mai înalt de corespondenţă este prezentat ultimul. în exemplul 
nostru, acesta conţine interacţiunea dintre abuzul fizic şi sex şi efectul principal al 
abuzului sexual. Acest model are un raport de probabilitate chi-square cu o valoare 
de 3,91 (rotunjit la un număr cu două zecimale), 2 grade de libertate şi un nivel de 
probabilitate de 0,271. Cu alte cuvinte nu este semnificativ, ceea ce înseamnă că 
datele observate pot fi reproduse cu aceste două efecte. 

» Pentru a interpreta aceste două efecte, trebuie să prezentăm datele în condiţiile unui 
tabel one-way pentru abuzul sexual şi ale unuia 2-way pentru abuzul fizic şi pentru 
sex. Putem face acest lucru folosind raportul chi-square... pentru tabelul one-way şi 
crosstabs... pentru tabelul bilateral. Aceste două tabele sunt prezentate mai jos. 
Tabelul one-way demonstrează că există mai mulţi pacienţi cu afecţiuni psihice care 
nu au fost abuzaţi sexual decât cei care au fost abuzaţi sexual. Tabelul 2-way indică 
faptul că în cazul bărbaţilor prezenţa abuzurilor fizice este mai probabilă decât în 
cazul femeilor. 


Physlcal abuse * Sex CrosstabuJation 



Sexual abuse 



® Putem vedea care este contribuţia fiecărei componente la modelul final. Chiar înainte 
de etapa finală (pasul 4 în acest exemplu), există un tabel mic intitulat „If Deleted 
Simple Effect is”. Acest tabel conţine o coloană numită „L.R. Chisq Change”. 
Aceste informaţii indică, practic, ajustarea (reducerea) gradului de corespondenţă al 
Raportului chi-square atunci când este îndepărtată fiecare componentă. Aşadar 
„Physical*Sex” are un raport de probabilitate chi-square corectat de 5.770, valoare 
care este semnificativă (0,0163). „Sexual" are o valoare de 16,435 care are o 
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semnificaţie mare (0,0000). în mod evident, aceste două efecte nu pot fi eliminate 
din model, din cauza contribuţiei lor semnificative. 

« într-un model ierarhic, componentele unei interacţiuni pot fi semnificative. Din 
moment ce „PhysicaPSex” are o contribuţie semnificativă la model, „Physical” şi 
„Sex” pot fi şi ele efecte principale semnificative. Selectaţi „Model” în caseta de dialog 
„Model” de la nivelul selecţiei analizei logliniare (pasul 3 din secţiunea 31.1). 
Fereastra care apare vă va permite să testaţi efectele principale prin specificarea 
modelelor care conţin doar aceste efecte principale specifice. 

31,3. Raportarea rezultatelor 

O modalitate de raportare a rezultatelor obţinute ar fi următoarea: „S-a efectuat o 
analiză de frecvenţă 3-way, pentru elaborarea unui model liniar ierarhic al abuzului fizic 
şi sexual la pacienţi cu afecţiuni psihice atât bărbaţi, cât şi femei. Prin metoda eliminării 
pas cu pas, s-a obţinut un model care conţine efectul principal al abuzului sexual şi 
efectul de interacţiune dintre abuzul fizic şi sex. Modelul are un raport de probabilitate 
X*(3) = 3,91, p = 0,27, valori care indică un grad mare de corespondenţă între 
frecvenţele observate şi frecvenţele anticipate generate de model. Aproximativ 38% din 
pacienţii cu afecţiuni psihice au fost abuzaţi sexual. Aproximativ 53% din bărbaţi au fost 
abuzaţi fizic, în comparaţie cu un procent de 39% în cazul femeilor”. 
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Regresia logistică multinomiaiă 


m Regresia logistică este o formă de regresie multiplă (vezi capitolul 28). Aceasta 
identifică variabilele care disting ia nivel colectiv cazurile ce aparţin diferitelor 
categorii ale unei variabile nominale (sau categoriale). De exemplu, poate fi 
folosită pentru identificarea caracteristicilor distinctive ale studenţilor la psihologie, 
sociologie sau fizică. 

w în altă ordine de idei, regresia logistică identifică grupurile de variabile care clasifică 
cu precizie persoanele în funcţie de apartenenţa acestora la diferitele categorii 
ale unei variabile nominale. 

as Regresia logistică binomiala se foloseşte dacă există doar două categorii de 
variabile care trebuie prevăzute. Această situaţie este tratată în capitolul 33. Regre¬ 
sia logistică multinomiaiă se foloseşte atunci când există trei sau mai multe categorii, 
n Predictorii (adică variabilele independente) potfi variabile numerice, variabile nomi¬ 
nale (sau categoriale) sau pot fi alcătuiţi dintr-o combinaţie a celor două categorii. 
w Cei mai buni predictori din categoria căreia îi aparţine un caz au ponderi-6 (sau 
ponderi de regresie) semnificative. Această practică este foarte asemănătoare cu 
procedurile mai cunoscute de analiză prin regresie multiplă descrise în capitolul 28. 
bi Valoarea lui Z?din regresia logistică se aplică, de fapt, la logaritmul natural al unei 
valori numite raportul şanselor, care reprezintă raportul frecvenţelor a două 
rezultate alternative. Acest logaritm este cunoscut şi sub numele de togit. De aici, 
termenul de regresie logistică. Raportul şanselor este pur şi simplu probabilitatea 
de apartenenţă la o categorie şi nu la alta. Majoritatea cercetătorilor au rareori 
nevoie să calculeze aceste valori, astfel încât valoarea logit are mai curând 
importanţă conceptuală decât practică. 

» Este mult mai important să înţelegem conceptul de variabilă de substituţie\ 
Aceasta este o metodă care ne dă posibilitatea de a trata numeric o variabilă 
nominală. Dacă variabila nominală are doar două categorii, atunci acestea pot 
fi codificate numeric prin valorile 0 şi 1. 

m Totuşi, dacă respectiva categorie nominală are trei sau mai multe categorii, 
procesul devine ceva mai complex. Practic, datele sunt codificate pentru a 
exprima prezenţa sau absenţa fiecăreia dintre cele trei( sau mai multe) categorii, 
în realitate, se creează trei (sau mai multe) variabile noi. Aşadar, dacă cele trei 
categorii se numesc A, B şi C, se mai creează alte trei variabile noi: 

(i) Individul aparţine Categoriei A (sau nu). 

(ii) Individul aparţine Categoriei B (sau nu). 

(iii) Individul aparţine Categoriei C (sau nu). 

Fiecare dintre aceste variabile reprezintă câte o variabilă de substituţie. 



■ Totuşi, ''totdeauna se exclude din analiză o variabilă de substituţie din acest 
set. Nu contează care anume. Motivul este acela că respectiva variabilă de 
substituţie nu conţine nici un fel de informaţii noi care să nu fie incluse în 
celelalte variabile de substituţie. 

* SPSS generează automat variabile de substituţie pentru variabila dependentă, 
dar trebuie să aibă informaţii referitoare ia care dintre variabilele predictori sunt 
nominale (variabile categoriale). 

■ Aplicaţia SPSS generează tabele de clasificare, acestea indicând predicţia 
apartenenţei la o anumită categorie, pe baza variabilelor predictori. Acesta 
reprezintă un indicator de încredere al calităţii predicţiei, deoarece se precizează 
şi numărul de clasificări corecte. 

■ Analizele prin regresie logistică includ şi un număr mare de statistici de tip 
goodness-of-fit, bazate pe coeficientul chi-square. Acestea au mai multe funcţii, dar 
cea mai importantă este reprezentată de faptul că indică îmbunătăţirea cores¬ 
pondenţei dintre categoria de apartenenţă prezisă şi apartenenţa reală la o 
categorie. Un predictor util ar trebui să îmbunătăţească gradul de corespondenţă 
dintre apartenenţa prezisă şi categoriile reale cărora le aparţin diferitele cazuri. 

■ Regresia logistică multinomiaiă trebuie folosită atunci când există trei sau mai 
multe categorii pentru variabila dependentă (prezisă sau criteriu). Dacă există 
doar două categorii pentru variabila dependentă, atunci se foloseşte, de obicei, 
regresia logistică binomiala (vezi capitolul 33). 

Utilizarea regresiei multinomiale poate fi ilustrată folosind informaţiile descrise în 

tabelul 32.1 ( ISP , tabelul 36.2). Aceste date provin dintr-un studiu fictiv al diferentelor 

Tabelul 32.1. Dale pentru regresia logistică multinomiaiă 



2 youngcr.'f low ■ . lupi, >w - no- ' M . yes 

4 oldcr hifih Ligii high yes no 

■ 5 ol<J« high high high yes >cs yes 

youuger.,«/0DW‘ gp ■ jiigL Wm/ăm no no 

8 older • .high lovv high yes no no 

| Wglfye» f 

15 ’ - 0}dcr iow high’ higli no . yes yes. 

fp youugcr high,, | |j| high * | A lovv I I yes ' Lno'Ţjfy 

g 1 $$$$9|ţia||gli|.‘ţ 

' 19 î younger ^,h gh , >e , < yes 


^;S«ces£f$l 

.irapisi-’’!' 

*U. 

wcp| 

"încest‘3' 
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dintre violatori, infractori sexuali incestuoşi şi pedofili. Aceasta înseamnă că pentru 
categoriile de infractori avem o variabilă nominală sau categorială cu trei valori diferite, 
în acest exemplu, toate variabilele predictori - vârsta, scala DAS (scala depresiei, 
anxietăţii şi stresului), ostilitatea mamei, ostilitatea tatălui, căminul copiilor, abuzul 
fizic şi abuzul sexual - sunt variabilele nominale (categorială) care au doar două valori 
diferite în fiecare caz. Trebuie să subliniem faptul că orice tip de variabilă poate fi folosit 
ca predictor în regresia logistică multinomială. Totuşi, cercetătorul trebuie să indice care 
sunt variabilele numerice din analiză. 


32.1. Introducerea datelor 

Aceste date sunt introduse în SPSS în maniera obişnuită, fiecare coloană reprezentând o 
variabilă. în scopuri didactice, informaţiile au fost repetate de 10 ori, pentru a se ajunge 
la un set de date realist, dar şi pentru a limita, în acelaşi timp, munca persoanelor care 
doresc să reproducă analiza cu exactitate. 


Introduceţi datele. 

Ponderaţi cazurile 
după valoarea 
„freq". 


în cazul tuturor analizelor prin regresie logistică, variabilele dummy sunt create de 
SPSS. Acest lucru se întâmplă întotdeauna în cazul variabilelor prezise (în acest caz, 
tipul de infracţiune), dar se poate realiza şi în cazul variabilelor-predictori nominale 
(categoriale) care au mai mult de două categorii. Dacă situaţia o necesită, SPSS generează 
variabile noi (variabile de substituţie) care vor fi incluse în analiză. Aşadar, nu trebuie să 
vă surprindă faptul că veţi găsi în output variabile care nu făceau parte din input-ul iniţial 
de date. SPSS nu afişează în foaia de lucru variabilele dummy pe care ie creează - totuşi, 
acestea sunt menţionate în output. SPSS creează automat variabile de substituţie adecvate 
pentru variabila dependentă (criteriu), pe baza numărului de valori (categorii) diferite 
ale acelei variabile. Variabilele predictori sau independente sunt şi ele codificate cu 
variabile de substituţie dacă sunt definite de către cercetător ca fiind variabile nominale 
(categoriale). Variabilele dummy sunt tratate pe larg în sumarul de îa începutul acestui 
capitol, ca şi în textul statistic adiacent (ISP, capitolul 36). 
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înainte de versiunea 12 a aplicaţiei SPSS, regresia logistică multinomială nu avea 
decât un număr de opţiuni relativ nesatisfăcător. Totuşi, începând cu versiunea 12, SPSS 
conţine şi o versiune stepwise în cadrul căreia variabilele sunt selectate ca predictori în 
ordinea puterii de predicţie independente pe care o au. în acest ghid, vom analiza datele 
folosind regresia logistică multinomială stepwise. Constatările diferă puţin la nivelul 
detaliilor de cele din textul statistic adiacent (ISP), dar diferenţele nu sunt substanţiale. 


32.2. Regresia logistică multinomială stepwise 


Pasul 1 

Selectaţi „Analyze’ 
„Regression" şi 
„Multinomial ^ 
Logistic...", v. 




Pasul 2 


Selectaţi „typoff şi apăsaţi 
butonul ► de lângă caseta 
„Dependent:" pentru a 
introduce opţiunea în casetă. 

Selectaţi celelalte şapte 
variabile fie separat, fie 
împreună (excluzând „freq”)' 
şi apăsaţi butonul 4 de lângă 
caseta „Factor(s):” pentru a le 
introduce. 

Selectaţi „Model...”. \ 
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Pasul 3 




Selectaţi „Continue". 


Selectaţi „Statistics..." din 
ecranul anterior, care va 
reapărea. 


Selectaţi „Custom/ 

Selectaţi fiecare dintre cele 
şapte variabile pe rând şi 
apăsaţi butonul « de lângă 
meniul „Stepwise terms:" 
pentru a le introduce acolo. 


Pasul 4 



Selectaţi „Cell probabilities' 
„Classificatlon table" şi 
„Goodness-of-fif. __ 

Selectaţi „Continue". 

Apăsaţi „OK" în ecranul 
anterior care va reapărea. 




mm 
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32.3. !nt?o oretarea output 


Regresia nominală 


Atenţie 


Există 37 (64,9%) celule (adică nivele de variabile dependente pe subpopulaţii) cu frecvenţa 

Procedura stepwise a fost întreruptă deoarece s-a descoperit o problemă numerică. 

Este posibil să existe o separaţie aproape completă a datelor. Fie nu există date estimative 
referitoare la probabilitatea maximă, fie unele valori estimative ale parametrilor sunt infinite. 
Procedura NOMREG va continua îri ciuda avertismentului(elor) de mai sus. Rezultatele 
afişate ulterior se bazează pe ultima iteraţie a ultimului model introdus în procedura 
stepwise. Valabilitatea corespondenţei modelului nu este sigură. __________ 


ageup Io 29 or 30 and 
above 

deprasslon and anxiaty 
scala 

moWer's hostilily to 
ofîsndaras chlld 
father'a tvMtlIlty lo 
offander as chlld 
spâni Hme in chiidren's 
home 

physicaiiy atwsod as a 
chlld 

Sexually abused as a 

chlld 

Valid 

Mlsslng 

Total 

Subpopulation 


Cat* Procaaalne Summary 



N 

—Marginal 

PercentagJr- 

raplst 

70 

35.0% 

Incestuous chikl abuser 

80 

40.0% 

-~iaaedophll8 

60 

25jJ2t- 

youngar .. 

older 

- rtr 

130 

-''"'35.0% 

65.0% 

low scor» 

00 

40.0% 

highscore 

120 

60.0% 

low hostilily 

9Q 

45.0% 

high hosliilty 

110 


how hostilily 

80 


hlgh hostilily 

120 

60.0% 


110 1 

55.0% 


60 

45.0% 

yea 

100 

50.0% 

NO 

100 

50.0% 

yes 

130 

65.0% 

na 

70 

35.0% 

200 

0 

200 

19* 

100.0% 


Acest tabel prezintă 
distribuţia fiecărei variabile 
din analiză. Distribuţia 
infracţiunilor este încercuită. 


a. Variabila dependentă are o singură valoare observată la 18 (94,7%) subpopulaţii. 
Acest tabel arată ordinea în care au fost selectate variabilele-predictori. 


Modelul din pasul 0 nu 
conţine variabile-predictori 
în pasul 1, se introduce 
variabila „childhom". 
Aceasta este cel mai bun 
predictor pe care îl avem la 
dispoziţie. 

„Sexualab” este ultima 
variabilă introdusă în 
ecuaţia de regresie. 

Analiza nu mai continuă 
după acest exemplu. 



Stop 8ummsry 


-2 Log 

Effect(s) UkBlIhood Chi-Square df Sig. 



Entered_1 Dhvsabus 1_274,195. 


Entered sexualab* I 258.708 



Metoda stepwise: introducerea progresivă 
a. Procedura stepwise a fost întreruptă deoarece a apărut o 
problemă de natură numerică. 
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Model Fftting Information 



-2 Log 
Likelihood 

Chi-Square 

df 

407.957 

258.708 

149.250 

8 



Goodness-of-FIt 

Chi-Square 


Modelul „Intercept Only" nu conţine nici una dintre 
variabilele predictori. Modelul „Final" este cel care 
foloseşte grupul format din cei mai buni predictori. 
Observaţi că există o îmbunătăţire semnificativă a 
corespondenţei dintre date atunci când se foloseşte 
modelul „Final". 


Acest tabel indică măsura în care 
datele prezise corespund datelor 
reale. Există o diferenţă semni¬ 
ficativă între cele două - aşadar, 
predicţia nu este perfectă. 


Cox and Snell 526 I Acest fab f 1 oferă trei valori estimative a, e -corelaţiei multiple" 

' dintre variabilele-predictori şi apartenenţa la una dintre cate- 

NageixerKe .594 goriile infractorilor sexuali. în acest caz, valorile sunt moderate 

McFadden .345 (1,00 ar indica o clasificare perfectă), ceea ce confirmă faptul 

că predicţia este imperfectă. 

Acesta este un tabel foarte important, care indică măsura în care îndepărtarea fiecăreia 
dintre variabilele-predictori din predicţie reduce în mod semnificativ corespondenţa predicţiei 
cu datele reale. După cum se poate vedea, în acest caz, îndepărtarea oricăruia dintre cei 
patru predictori afectează în mod contrar corespondenţa datelor prezise cu datele actuale. 

\ 

Llkellhood Ratlo Testa 


Pearson 

240.587 

Deviance 

255.236 

Pseudo R-Squars 

Cox and Snell 

.526 

Nagelkerke 

.594 

McFadden 

.345 


Effect 

-2 Log 
Llkeiihood of 
Reduced 
Model 

Chl-Square 

df 

Slg. 

Intercept 

258.708’ 

.000 

0 


age 

275.878 

17.170 

2 

.000 

childhom 

287.336 

28.628 

2 

.000 

physabus 

298.372 

39.664 

2 

,000 

sexualab 

274.195 

15.487 

2 

,000 


Statistica chi-square reprezintă diferenţa dintre probabilităţile -2 log 
dintre modelul final şi un model redus. Modelul redus se formează prin 
omiterea unui efect din modelul final. Ipoteza nulă este aceea că toţi 
parametrii acelui efect sunt 0. 

a. Acest model redus este echivalent cu modelul final, deoarece omiterea 
efectului nu intensifică gradul de libertate. 
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Incestuous chiid abuser Intercet 
/'"-'Tage^i 
V _[aae=2 


Observed 


\ Percent 
\ Correct 


raplst 


Incestuous 
chiid abuser 


Acest tabel indică ponderile b pe care computerul le va folosi atunci când realizează predicţiile. 
Ponderile b sunt utile pentru raportare, dar cercetătorul nu are, de fapt, nevoie să le folosească 
în calcule. 


Atunci când interpretaţi output-ul, valorile variabilei 
trebuie verificate cu atenţie. Ponderea b este -1,533 
pentru categoria 1,00 a variabilei vârstă - celeilalte 
categorii îi este asociată o pondere de 0,00. Eticheta de 
valoare de 1,00 din acest caz înseamnă că infractorul 
era mai tânăr. Totuşi, există şi o valoare negativă a lui b. 
Acest lucru înseamnă că infractorii incestuoşi care 
abuzează de copii se disting. în parte, de celelalte 
două grupuri, prin faptul că sunt mai în vârstă. Acest 
lucru poate crea confuzii Sa început, dar este pur şi 
simplu modul în care operează aplicaţia SPSS. 


Tabelul de clasificare indică într-o manieră simplă cât de bună a fost predicţia. 
După cum se poate vedea, predictorii sunt foarte performanţi în ceea ce 
priveşte predicţia corectă a violatorilor (85,7% cazuri corecte). Predictorii nu 
prezic bine pedofilii (doar 20% dintre pedd’M sunt identificaţi corect). 

Classlflcatlon \ \ _ 


Eroarea standard este de 0,00, 
ceea ce înseamnă că valoarea 
Wald ar fi infinit de mare. Nici unul 
dintre nivelele de semnificaţie nu 
poate fi procesat, deşi această 
variabilă este foarte semnificativă 
din punct de vedere statistic. 


Paramotar Estimata» 


95% Confidence Interval for 
Exp(B) 


B I Std. Error | Wald | df | Slg. | Exp(B) | Lower Bound | Upper Bound 


type of offonce* 
raplst 


.608 

.218 

0 ° 

-2.252 

0 6 

20.124 6 

0 

-18.582 

0 ° 


.851 1 .356 

.152 1 .697 1.243 


Intercept 

£age=1] 

[age=2] 

[childhom=1] 

[chlldhom=2] 

[physabus=l] 

[physabus=2] 

[sexuaiab=l] 

fsexualab=2] 


.416 


3.718 


105 


.545 17.042 1 .000 

0 

.613 1077.1 1 .000 


036 


.306 


165110941.9 I 1826627708 


000 


.000 


.000 


.326 

-1.533 

0 b 

.122 

0 b 

.782 

\ ° b 
\299 

\0 b 


565 .334 1 \563 

455 11.330 1 \ 

. o .am 

486 .063 1 \ . 


216 


.088 


.527 


1.130 


[childhom=1] 
[chlldhom=2] 
[pfiysabus=1] 
[ptiysabus=2] 
[sexualab=l] 
fsexualab=2] 


,436 


2.929 


2,185 


,496 


2.485 1 1 

. 0 I .11 


.827 


5.774 


1.348 


.455 


.431 II 

.01 .512 


.552 


3.291 


a. Categoria de referinţă este: pedofil. \ . ' 

b. Valoarea acestui parametru este stabilită la zero pentru că este un parametru redundant. 


’ 45.0% 


60.0% 


































236 


INTRODUCERE ÎN SPSS PENTRU PSIHOLOGIE 


REGRESIA LOCHSTICĂ MULTINOMIALĂ 


237 


Aid sunt afişate toate combinaţiile posibile de valori ale variabilefor-predictori. Prin urmare, acest 
tabel poate fi folosit pentru identificarea celui mai probabil rezultat prezis, In cazul oricărei 
combinaţii de variabile-predictori. Adică modelul predictor al unui anumit infractor ar putea fi 
folosit pentru a identifica cea mai probabilă predicţie pentru modelul respectiv. 
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Procentele se bazează pe totalul frecvenţelor observate în cazul fiecărei subpopulaţii. 


în cazul regresiei logistice multinomiale, output-ul este unul substanţial. Desigur, 
este posibil să reducem numărul de rezultate, dar în acest caz trebuie să specificaţi cu 
claritate care dintre aspectele output-ului nu sunt esenţiale obiectivului dumneavoastră. 
Din moment ce este mai uşor să ignorăm tabelele care sunt în plus decât să refacem 
analiza, este de preferat să greşim în plus şi să avem un număr prea mare de rezultate 
decât invers. 

■ Este bine să vă amintiţi să examinaţi tabelul intitulat „Case Processing Summary”. 
Acesta vă va reaminti distribuţia categoriilor fiecărei variabile din analiză. In exemplul 
nostru, toate variabilele au doar două categorii, şi de aceea nu este necesară crearea 



variabilele- ac substituţie. Totuşi, este posibil ca variabilele predictori să aibă tei sau 
mai mulţi .iitegorii, caz în care SPSS va crea automat variabile de substituţie 
corespunzătoare pentru toate categoriile respectivei variabile, în afară de una. (Această 
metodă nu se aplică în cazul variabilelor care sunt definite drept covariate, acestea 
fiind tratate ca variabile numerice.) Există totuşi trei valori diferite ale variabilei 
criteriu a tipului infracţiunii - violatori, infractori incestuoşi şi pedofili, iar aplicaţia 
SPSS va crea două variabile de substituţie pentru aceste trei categorii. 

■ Tabelul „Step Summary” indica, practic, secvenţa variabilelor introduse în 
regresia multiplă stepwise. Amintiţi-vă că în cazul analizei stepwise, predictorii sunt 
selectaţi în funcţie de puterea lor (diferită) de predicţie. Aşadar, cel mai bun 
predictor este selectat primul, după ce sunt făcute ajustările necesare, apoi se alege 
cel mai bun predictor dintre cei rămaşi şi aşa mai departe. Există şi un pas 0, care 
conţine doar intercepţia liniei de regresie. în acest exemplu, paşii 1-4 aduc pe 
rând cei mai puternici predictori. Variabila „childhom” este adăugată în pasul 1, iar 
„vârsta” - în pasul 2. „Physabus” este adăugat în pasul 3, iar „sexualab” - în pasul 
4. Fiecare dintre aceşti paşi determină o corespondenţă semnificativ mai mare între 
datele prezise (modelate) şi cele reale. Acest lucru se poate vedea prin micşorarea 
valorilor probabilităţilor -2 log (care sunt valori chi-square) date în tabel. Fiecare 
dintre aceste modificări este semnificativă în acest exemplu, ceea ce înseamnă că nici 
unul dintre predictori nu poate fi eliminat fără a periclita acurateţea clasificării. 

■ Tabelul „Model Fitting Information” dă valoarea probabilităţii -2 log a coeficientului 
chi-square pentru corespondenţa modelului (adică predictorii semnificativi plus 
intercepţia). Această valoare este semnificativă în acest caz. Nu este decât un semn 
că modelul (variabilele predictori) nu prezice în totalitate datele reale. Cu alte cuvinte, 
predicţia este incompletă sau parţială. în mod evident, există şi alţi factori care 
trebuie luaţi în considerare pentru obţinerea unei corespondenţe perfecte între model 
şi date. De obicei, aceasta este situaţia. 

■ Tăbelul statisticii „Pseudo R 2 " nu face decât să confirme acest lucru. Statistica R 2 
oferă corelaţia combinată dintre un set de predictori şi variabilele prezise pentru 
datele numerice. Coeficientul pseudo R 2 este similar acestui procedeu în ceea ce 
priveşte interpretarea, dar este folosit atunci când nu este posibilă procesarea corectă 
a statisticii R 2 propriu-zise, aşa cum se întâmplă în cazul regresiei logistice. După 
cum se poate vedea, s-au folosit trei metode diferite de calcul. Toate cele trei sunt 
determinate de relaţia combinată dintre predictori şi variabilele categoriale. Valoarea 
zero înseamnă că nu există corelaţie multiplă, valoarea 1,00 semnifică o corelaţie 
multiplă perfectă. Valorile situate în jurul numărului 0,5 sunt destul de satisfăcătoare, 
deoarece indică o corelaţie combinată generală dintre variabilele predictori şi variabila 
prezisă cu o valoare de aproximativ 0,7. (Aceasta se obţine prin extragerea rădăcinii 
pătrate a valorii 0,5.) 

■ Tabelul „Likelihood Ratio Tests” ne relatează ce se întâmplă cu modelul dacă 
eliminăm, pe rând, fiecare dintre variabilele-predictori. Modelul nu este altceva decât 
un set de predictori care apar în analiză. în acest caz, avem patru predictori, aşa cum 
s-a specificat deja. în fiecare caz, există o descreştere semnificativă la nivelul 
corespondenţei dintre datele prezise şi cele reale, în urma eliminării unuia dintre 
predictori. Cu alte cuvinte, fiecare dintre predictori are un efect semnificativ şi ar 




trebui, în mod normal, să fie păstrat. Desigur, dacă cercetătorul are motive întemeiate, 
oricare predictor poate fi eliminat, deşi cercetătorilor neexperimentaţi li se recomandă 
să nu facă acest lucru. 

® Tabelul „Parameter Estimates” indică, practic, ponderile de intercepţie şi regresie în 
cazul acestei analize de regresie multinomială. Valoarea intercepţiei este de exact 
0,608 în cazul violatorilor. Dar observaţi o serie de lucruri. Variabila dependentă 
(tipul de infracţiune), care are trei categorii, a fost transformată în două variabile de 
substituţie „violatori” (faţă de celelalte două grupuri) şi „agresori incestuoşi care 
molestează copii” (faţă de celelalte două grupuri). Ţineţi minte că numărul de 
variabile de substituţie se obţine din numărul de categorii minus unu. Există trei 
categorii de infractori, aşadar vom avea două variabile de substituţie. Variabilele 
dummy sunt create prin luarea uneia dintre cele trei categorii de infractori şi compa¬ 
rarea cu restul categoriilor de infractori. în exemplul nostru, avem: 

- violatori faţă de agresori incestuoşi care molestează copii şi pedofili; 

- agresori incestuoşi care molestează copii faţă de violatori şi pedofili; 

- pedofili faţă de violatori şi agresori incestuoşi care molestează copii. 

Alegerea uncia dintre cele trei variabile de substituţie posibile este una arbitrară şi 
poate fi variată prin selectarea opţiunii „Custom/Stepwise” în pasul 3 al secţiunii 
32.2. De asemenea, observaţi că variabilelor li s-au asociat două ponderi de regresie - 
câte una pentru fiecare valoare. Totuşi, una dintre perechi este întotdeauna zero, ceea 
ce, practic, înseamnă că aceste valori nu au contribuit cu nimic la realizarea calculului. 
Semnificaţia fiecăreia dintre aceste ponderi de regresie este dată de una dintre 
coloanele din tabel. Semnificaţia se bazează pe valoarea Wald care este dată într-o 
altă coloană. Nu trebuie să vă faceţi probleme dacă nu înţelegeţi foarte bine acest 
lucru din moment ce nu este nevoie să faceţi calcule propriu-zise. Metoda este 
explicată în detaliu în textul statistic adiacent ( ISP , capitolul 36). 

88 ' Tabelul „Clasxificatlon" este foarte important şi dă precizie predicţiilor, pe baza 
parametrilor estimativi. Acest tabel de asociere indică ce predicţii ar putea fi realizate 
pe baza variabilelor-predictori semnificative şi cât de precise ar putea fi aceste 
predicţii. După cum se poate vedea, predicţiile sunt foarte precise în cazul violatorilor 
şi mai puţin exacte în cazul agresorilor incestuoşi care molestează copii. Totuşi, 
clasificarea este slabă în cazul pedofililor. 

■ Tabelul „Observed and Predicted Frequencies” este, probabil, folositor mai ales 
pentru cei care au o situaţie practică în care doresc să facă cea mai bună predicţie a 
categoriei pe baza variabilelor predictori. Tabelul oferă toate modelele posibile de 
variabile predictori (în SPSS acestea se numesc covariate) şi clasificările reale ale 
datelor pentru fiecare model şi afişează şi cel mai probabil final prezis pe baza 
respectivului model. Cu alte cuvinte, tabelul ar putea fi folosit pentru a realiza 
predicţii pentru cărările individuale, pe baza modelelor individuale cunoscute. 


32.4. Raportarea constatărilor 


Nu există nici o metodă convenţională de raportare succintă a constatărilor în cazul 
regresiei logistice multinomiale. Dacă tehnica a mai fost folosită în studii anterioare din 
respectiva arie de cercetare, puteţi adopta aceleaşi metode de raportare utilizate anterior.. 

în cazul analizei de date realizate în acest capitol, este evident că există o serie de 
predictori care funcţionează în parte relativ eficient. O modalitate de raportare a acestor 
constatări ar fi următoarea: „Regresia logistică multmomială a fost efectuată pentru a 
stabili care sunt caracteristicile care disting cele trei tipuri de infractori. S-a demonstrat 
că patru dintre cele şapte variabile-predictori incluse în analiză diferenţiază intr-o anumită 
măsură cele patru tipuri distincte de infractori. Violatorii au fost identificaţi corect ca 
atare în 85,7% din cazuri, agresorii incestuoşi care molestează copii au fost identificaţi 
corect în 62,5% din exemple, dar pedofilii au fost identificaţi corect doar m 20% din 
situaţii. S-a observat o tendinţă foarte frecventă de a categorisi greşit pedofilii ca fiind 
infractori incestuoşi care molestează copiii. Predictorii care au diferenţiat cel mai ine 
violatorii au fost timpul petrecut într-o casă unde locuiesc copii (b - --,252), abuzu izic 
(b = 20,124) şi abuzul sexual (b - -18, 582). Ultimul predictor nu este reportat în tabel 
ca fiind semnificativ ca atare. Nu i sc acordă nici un fel de semnificaţie. Totuşi, pedofilu 
au fost cel mai bine diferenţiaţi de celelalte două grupe doar după vârstă (.b - -1,533) . 





Regresia logistică binomială 


Rezumat 

n Regresia logistică binomială poate fi considerată a fi un caz particular al regresiei 
logistice multinomiale care a fost descrisă în capitolul 32. Distincţia esenţială 
este aceea că diferenţiază caracteristicile persoanelor în doar două grupuri diferite, 
n Aplicaţia SPSS are un repertoriu mult mai bogat de .tehnici de regresie pentru 
regresia logistică binomială, deşi versiunile 12 şi 13 au adus puţin mai multă 
flexibilitate procedurilor referitoare la regresia logistică multinomială. 
m Regresia logistică binomială este o formă de regresie multiplă. Aceasta identifică 
modele de variabile care pot diferenţia cu eficacitate membrii a două categorii 
diferite. Aşadar, regresia logistică binomială prezice apartenenţa la o anumită 
categorie la fel cum o face o valoare numerică în cazul regresiei multivariate 
(capitolul 28). De exemplu, puteţi folosi această metodă pentru examinarea 
modelului de variabile care face diferenţa cel mai bine între bărbaţii şi femeile 
care participă la un studiu asupra motivelor de consultare a medicului. Poate 
apărea un model al motivelor pentru care bărbaţii merg la doctor diferit de 
modelul motivelor pentru care femeile fac acest lucru. 
m Altfel spus, regresia logistică binomială foloseşte variabile predictori pentru a 
prezice căreia dintre categoriile variabilei dependente este mai probabil să 
aparţină diferiţi indivizi. 

m Procedura de regresie logistică binomială calculează valorile b (sau ponderile de 
regresie), în mod asemănător metodei folosite în regresia multiplă (capitolul 28). 
Marea diferenţă este aceea că în cazul regresieijogistice binomiaie aceste 
ponderi b nu se aplică pentru prezicerea scorurilor. în schimb, se aplică în cazul 
unei mărimi numite /ogit, care este logaritmul natural al raportului şanselor. 
Raportul şanselor este asemenea unei probabilităţi. Nu este altceva decât 
raportul dintre numerele dintr-o categorie şi numărul cazurilor din altă categorie, 
în general, valorile logit{ ca, de altfel, şi logaritmii naturali) nu sunt esenţiale în 
utilizarea regresiei logistice binomiaie de către un cercetător, şi de aceea nu 
este necesară înţelegerea profundă a acestui concept. 
m Deşi categoriile sunt întotdeauna variabile categoriale binomiaie (binară sau cu 
două valori), celelalte variabile din analiză pot fi variabile numerice, nominale 
(categoriale) sau pot fi o combinaţie între cele două tipuri, 
n Orice variabilă categorială care are mai mult de două categorii este transformată 
în mod automat de către SPSS într-un grup de variabile de substituţie. Din motive 
tehnice, una dintre variabilele dummy posibile este omisă în mod arbitrar din 
regresia logistică binomială. Acest lucru se întâmplă deoarece nu conţine nici un 
fel de informaţii noi care să nu fie deja prezente în celelalte variabile de substituţie. 
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* Regrto a binomială, de exemplu, poate începe prin folosirea procedurilor stepwise, 
introdu, cerea progresivă a predictorilor slabi, eliminarea regresivă a predictorilor 
slabi şi aşa mai departe. Alegerea tipului de model care trebuie folosit este de multe 
ori o chestiune destul de subtilă. Procedurile stepwise construiesc gradat modelul 
prin selectarea pas cu pas a variabilelor care pot să diferenţieze bine între membrii 
celor două categorii ale variabilei dependente. Introducerea progresivă înseamnă 
că, odată cu fiecare pas, computerul identifică variabila rămasă care reuşeşte cel 
mai bine să diferenţieze între cele două categorii. Dacă nu sunt îndeplinite anumite 
condiţii în ceea ce priveşte puterea de predicţie (sau clasificare), atunci respectiva 
variabilă nu este introdusă în model. în psihologie, metoda introducerii progresive 
stepwise este o alegere bună pentru realizarea multor studii. 

* O mare parte din output-ul SPSS al regresiei logistice binomiaie constă în 
factori care indică măsura în care datelor modelate (apartenenţa la o anumită 
categorie prezisă de către variabileîe-predictori) corespund datele reale (cate¬ 
goria reală căreia îi aparţine individul). Aceşti indicatori se bazează în mare măsură 
pe coeficientul chi-square. Un predictor util ar trebui să îmbunătăţească cores¬ 
pondenţa dintre apartenenţa prezisă şi categoriile reale cărora le aparţin cazurile. 

■ Mai uşor de înţeles sunt tabelele de clasificare generate de SPSS, care indică 
măsura în care predicţiile corespund clasificărilor reale. 

Exemplul pe care îl vom folosi este un studiu al variabilelor care ar putea fi folosite 
la evaluarea probabilităţii ca un prizonier să comită o nouă infracţiune sau nu după 
ieşirea din închisoare. Comiterea unei noi infracţiuni este cunoscută sub numele de 
recidivă. Datele din studiu sunt prezentate în tabelul 33.1 ( ISP, tabelul 37.5). Din motive 
pedagogice şi pentru comoditatea celor care doresc să urmeze pe computer paşii pe 
care-i efectuăm, cele 19 cazuri sunt reproduse de cinci ori. După cum se poate vedea, 
recidiva este o variabilă categorială binomială - într-o anumită perioadă de timp, 
prizonierul fie recidivează, fie nu. Din moment ce scopul analizei noastre este acela de 
a identifica modele de variabile care prezic în care dintre aceste două categorii se va 
încadra un prizonier, atunci acesta constituie în mod evident un set de date pentru 
regresia logistică binomială. 

Orice tip de variabilă - numerică sau nominală (categorială) - poate fi folosit ca 
variabilă-predictor în regresia logistică binomială. Totuşi, în exemplul nostru, am folosit 
variabile foarte simple, cum ar fi vârsta, detenţia anterioară, tratamentul, remuşcările, 
starea civilă şi faptul că infractorul a comis sau nu o infracţiune sexuală. Toate acestea 
sunt variabile nominale binomiaie. Putem folosi variabile numerice, care sunt definite 
drept covariate în SPSS. Putem folosi, de asemenea, variabile nominale (categoriale) 
având trei sau mai multe valori (categorii) diferite. în acest caz, SPSS recodiflcă variabila 
transformând-o automat într-o serie de variabile de substituţie. Aceasta înseamnă că setul 
de variabile-predictori este, în realitate, mai mare decât numărul iniţial de variabile din 
date. Dacă am avea o variabilă cum este tipul de infracţiune, aceasta având la rândul ei 
mai multe categorii, cum ar fi infracţiunile sexuale, infracţiunile violente şi furtul, 
atunci, teoretic, am putea crea trei variabile de substituţie. Acestea ar fi: 

- Variabila dummy 1 ~ infracţiune sexuală sau nu; 

- Variabila dummy 2 == infracţiune violentă sau nu; 

- Variabila dummy 3 = furt sau nu. 



în realitate, crearea variabilelor de substituţie este la fel de simplă cum este şi crearea 
variabilelor dummy. Există o singură complicaţie pe care trebuie să o avem în vedere. Una 
dintre variabilele de substituţie nu conţine, de fapt, nici o informaţie nouă dacă ştim care 
sunt valorile unei persoane referitoare 1a celelalte două variabile de substituţie. 


Tabelul 33.1. Date pentru studiul recidivei - datele preluate din 19 cazuri 
sunt reproduse de cinci ori, pentru a oferi un eşantion de dimensiuni 
realiste pentru simplificarea explicaţiilor 



Aşadar, atunci când ştim că o persoană nu a comis o infracţiune sexuală şi ştim că nu 
a comis nici o infracţiune violentă, înseamnă că respectiva persoană a comis un furt. Din 
moment ce toţi indivizii sunt infractori, acesta nu este decât un raţionament logic simplu. 
Din cauza faptului că întotdeauna există o variabilă de substituţie care se repetă şi este 
redundantă, în regresia logistică avem întotdeauna un număr cu unu mai mic decât 
maximum de variabile de substituţie. SPSS alege în mod arbitrar variabila dummy pe 
care să o elimine dacă utilizatorul nu face nici o precizare în acest sens. 

Tabelul 33.2 ilustrează o modalitate de codificare a datelor pregătite pentru analiza cu 
ajutorul computerului. Cel mai bine este să introduceţi în SPSS datele sub formă 
numerică, astfel încât fiecărei variabile să i se asocieze un cod numeric. Cifrele 1 şi 0 au 
fost folosite în fiecare caz pentru a indica prezenţa sau absenţa unei caracteristici. 
Acestor valori li se vor da ulterior etichete valorice îs SPSS, astfel încât ouiput-ul să fie 
cât mai dar. 


Regresia logistică binomială din SPSS are o varietate largă de opţiuni de analiză, 
începătorilor li se va părea puţin derutantă mulţimea posibilităţilor şi multe dintre 
opţiuni nu vor prezenta nici un interes pentru mulţi cercetători. Alegerea opţiunilor 
adecvate (ceea ce unii ar numi modelul adecvat) depinde foarte mult de scopul analizei 
care se efectuează, iar cercetătorul este singurul care cunoaşte acest aspect. în general, 
dacă unicul scop al analizei este obţinerea celui mai bun set de predicţori pentru 
clasificarea persoanelor, atunci este suficient să introduceţi toţi predictorii în acelaşi 
timp - SPSS ia pur şi simplu variabilele în ordinea în care sunt enumerate. Totuşi, de 
obicei, cercetătorul încearcă să construiască o explicaţie conceptuală/teoretică; de 
exemplu, vor să afle motivul pentru care unii infractori recidivează în acest exemplu. In 
aceste condiţii, este posibil ca cercetătorul să dorească să acorde prioritate în analiză unora 
dintre variabile. Aceasta implică introducerea ierarhică a predictorilor în blocuri. In plus, 


Tabelul 33.2. Datele din tabelul 33.1 codificate bimr cu 0 şi 1 pentru fiecare variabilă 



este necesară identificarea celor mai buni predicţori. Variabilele pot fi introduse pas cu 
pas, cel mai bun predictor fiind luat primul, apoi cel mai bun dintre predictorii rămaşi 
este introdus ai doilea (permiţând realizarea corelaţiilor dintre predicţori) şi aşa mai 
departe, până când nu se mai poate realiza nici o îmbunătăţire semnificativă în ceea ce 

priveşte predicţia. . . . 

O altă posibilitate ar fi introducerea iniţială a tuturor predictorilor, apoi eliminarea 
lor unul câte unul. Dacă eliminarea celui mai slab predictor reduce semnificativ acurateţea 
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INTRODUCERE ÎN SPSS PENTRU PSIHOLOGIE 


Pasul 3 

Selectaţi „recidivi" şi apăsaţi 
butonul > de lângă caseta 
„Dependent;" pentru a 
introduce opţiunea acolo. 

Selectaţi celelalte şase 
variabile (în afară de Jreq") . 
şi apăsaţi butonul « de lângă 
caseta „Covariates:” pentru a 
le introduce acolo. 

Selectaţi „Categorical...”. 


predicţiei, înseamnă că acesta trebuie păstrat. Totuşi, ei poate fi eliminat dacă îndepărtarea 
sa nu produce nici o schimbare în exactitatea predicţiei. Procesul continuă pas cu pas, 
prin analizarea efectelor îndepărtării celui mai slab predictor dintre cei rămaşi. Există o 
singură complicaţie pe care trebuie să o aveţi în vedere - aceea că predtctorii eliminaţi 
pot, de fapt, să revină în rândul grupului de predictori dacă eliminarea unei alte variabile 
are ca rezultate creşterea puterii predictive independente a variabilei eliminate anterior. 

în cele din urmă, eliminarea regresivă nu este mai bună decât alte abordări, ci, în 
mare, adoptă doar o metodă diferită. Nici nu va da neapărat exact aceleaşi rezultate ca 
alte metode - pur şi simplu, este o abordare rezonabilă şi adecvată a datelor. 
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33.1. Regresia logistică bînomială 


Pasul 1 

introduceţi datele. 
Ponderaţi cazurile 
folosind variabila „freq' 


Pasul 4 


Selectaţi toate cele şase 
variabile şi apăsaţi butonul < 
de lângă caseta „Categorical 
Covariates:” pentru a le 
introduce acolo. 

Selectaţi „Continue". 
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Pasul 5 

Apăsaţi butonul ▼ din 
caseta „Method;", deplasaţi 
bara de derulare până 
vedeţi opţiunea „Backward 
Wald" şi selectaţi-o. 

Apăsaţi „OK". 


Pasul 2 

Selectaţi „Analyze' 
„Regression" şi 
„Binary Logistic..." 
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Unweighted Cases* 

N 

Percent 

Selected Cases Inciuded in Analysis 

19 

100.0 

Misslng Cases 

0 

.0 

Total 

19 

100.0 

Unselected Cases 

0 

.0 

Total 

19 

100.0 



a. Dacă ponderea este activată, consultaţi tabelul de clasificare pentru a 
verifica numărul total de cazuri. 


Dependent Variable Encodlng 


Origina! Vaiue 

No 

yes 


Internai Vaiue 


Verificaţi acest tabel - explică modul exact în care a 
fost codificată variabila dependentă de către aplicaţia 
SPSS („Internai Valu@"). în acest caz, valorile interne 
sunt identice cu valorile pe care le-am introdus, dar 
merită să verificaţi, pentru prevenirea unor erori grave. 


Categorica! Varlables Codlngs 



Frequency 

(D 

sex offender 

sex offender 

10 

1.000 


not sex offender 

9 - 

_000_ 

prevlously in prison 

no prsvious 

11 

1.000 


previous prison 

8 

,000 

has recelved treatment 

treated 

11 

1.000 

In prison 

not treated 

8 

.000 

shows contrltlon for 

Contrite 

10 

1.000 

offence 

not contrite 

9 

.000 

married 

married 

7 

1.000 


not married 

12 

.000 

age group 

older (30 plus) 

10 

1.000 


vounger 

9 

.000 


în acest tabel se 
descompune fiecare 
variabilă, specifi- 
. cându-se numărul 
exact de persoane din 
flecare categorie. 
Aşadar, există nouă 
persoane în 
eşantionul celor care 
nu sunt infractori 
sexuali. 
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Blocul 0: blocul iniţial 


Blocul 0 reprezintă momentul anterior 
luării în considerare a vreunuia dintre 
predictori. în generai, puteţi sări peste 
această etapă. 


Clasalflcatlon Table' 6 



Predlcted 

recidivist 

Observed 

No yes Correct 

Step 0 recidivist No 

50 0 100.0 

yes 

45-*_^ .0 

Overall Percentage 

-^52^6 


a. Constanta este inclusă în model. 

b. Valoarea de rotunjire este de 0,500. 



Varlables in tha Equatlon 


Acest tabel specifică numărul real 
de recidivişti şi nerecidivişti. 

Există 45 de recidivişti şi 50 de 
nerecidivişti. 


B 

S 

.E. 

Wald 

df 

Sig. 

Exp(B) 

-.105 

,205 

.263 ! 

1 

.608 

.900 


Constanta este mai mult sau mai puţin aceeaşi ca şi 
intercepţia din cazul regresiei muitivariate. 


Step Varlables 
0 


Varlables not In the Equatlon 


age(1> 

preprls(l) 


Overall Statlstlcs 


contrlte(l) 

married(l) 

sexoff(l) 


Score 

df 

Sig. 

2.299 

1 

.129 

21.159 

1 

.000 

6.345 

1 

.012 

31.714 

1 

.000 

.452 

1 

.501 

,293 

1 

.588 

50.804 

6 

.000. 



în această etapă nu au fost incluşi predictori, astfel încât nu poate apărea nici unul în 
ecuaţia de regresie. 
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Blocul 1: Metodă = stepwise regresiv (Waid) 


Omnibus Teste of Modei Coefficients 

1 Chi-square df 


Step 1 

— Swp — l 

Biqck 

Model 

__ 70 . 951 .. 

70.953 

70.953 

6 

6 

6 

.000 

.000 

.000 

Step 2* 

Step 

-3.825 

-- .az.i2a- 

1 

5 

.050 

.000 


Modal 

67.128 

5 

.000 

Step 3* 

Step 

Block, 

Model 

-17,310 
49.818 
49.818 ' 

1 

4 

4 

.000 

.000 

.000 

Step 4» 

Step 

Block 

Modei 

-.116 

49.702 

49.702 

1 ' 
3 

3 

.733 

.000 

.000 

Step 5 

Step 

Block 

Model 

16.968 

66.670 

66.670 

1 

4 

4 

.000 

.000 

! .ooo 


Blocul 1 conţine tabelele- 
-cheie. 

Pasul 1 include toţi 
predictorii. 


Pasul 2 şi paşii ulteriori de 
dedesubt implică 
eliminarea unei variabile - 
adică reprezintă paşii de 
eliminare regresivă. 

Tabelul „Variables in the 
Equation" (care urmează) 
indică predictorii prezenţi 
în model în fiecare etapă. 


a O valoare negativă a lui chi-square indică faptul că valoarea 
chi-square a scăzut faţă de etapa anterioară. 


Model Summary 



a. Estimarea s-a încheiat la iteraţia numărul 20, deoarece 
s-a atins numărul maxim de iteraţii. 

Soluţia finală nu a fost găsită. , narprp 

b. Estimarea s-a încheiat la iteraţia numărul 6, deoarece 
parametrii estimativi s-au modificat cu mai puţin de 0,001. 


Aceştia sunt Indicii de 
corespondenţă a modelului 

cu datele reale. Cu cât sunt 
mai apropiate de 1,0 cele 
două valori (pseudo) cu 
atât mai mare este cores¬ 
pondenţa modelului cu datele 
reale în etapa respectivă. Cu 
cât este mai mică valoarea 
probabilităţii -2 log, cu atât 
se potriveşte mai bine 
modelul cu datele reale. 

Observaţi că modelul final 
(pasul 5) are o corespon¬ 
denţă mai mare - s-a permis 
reintrarea unei variabile în 
ecuaţia de regresie. 
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CigssîfJcatlon Table* 


Observed 


Step 1 

recidivist 

No 


Overall Percentage 

yes 

Step 2 

recidivist 

No 


Overall Percentage 

yes 

step 3 

recidivist 

No 


Overall Percentage 

yes 

Step 4 

recidivist 

No 


Overall Percentage 

yes 

Step 5 

recidivist 

No 


Overall Percentage 

yes 


Valoarea de rotunjire este de 0,500. 


Predicted 

recidivist 

Percentage 

Correct 

No 

yes 


15 5 90.0 

5 40 88.9 

89.5 



Acest tabel indică acurateţea clasificării în fiecare 
etapă. Exactitatea generală rămâne constantă pe 
toată perioada - se schimbă doar proporţiile 
relative dintre recidiviştli şi nerecidiviştii 
identificaţi corect. în funcţie de obiectivele 
cercetătorului, este posibil să fie mai util unul 
dintre modelele anterioare. De exemplu, dacă 
este mai important să îi identificăm corect pe cei 
care nu vor recidiva, atunci modelele din paşii 3 
şi 4 sunt de preferat, deoarece acestea identifică 
nerecidiviştii cu acurateţe mai mare. 
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Cel mai puţin semnificativ predictor din pasul 1 se alege pentru 
eliminare în pasul 2. Atât „treatmen", cât şi „sexoff au semnificaţii 
de 0,998, dar „treatmen" apare primul şi de aceea este ales. 


Variablea In the EquaUon 0 



B 

SE. 

Wald 

df N 

Slg. 

Exp(B) 

Stepl* age(1) 

-2.726 

.736 

13.702 

i 

\ .000 

.065 

prepris(l) 

-1.086 

.730 

2.215 

i 

\ .137 

.337 

treatmen(l) 

19.362 

8901.292 

.000 

i 

C -99ŞT) 

2.6E+08 

contrite(l) 

-41.459 

11325.914 

.000 

i 

.997 

.000 

manied(l) 

-.307 

.674 

.208 

1 

.,648 

.735 

sexoff(l) 

-20.641 

7003.093 

.000 

1 


.000 

Constant 

23.802 . 

7003.093 

.000 

i 

.997 

2.2E+10 

Step 2* age{1) 

-2.775 

.787 

12.417 

i 

.000 

.062 

preprls(l) 

-1.471 

.717 

4.210 

i 

.040 

.230 

comrlte(1} 

-22.879 

7449.317 

.000 

i 

.998 

.000 


-.448 

.667 

,450 

i 

.502 

.839 








sexoff(l) 

-21.102 

7449.317 

,000 

1 

.998 

.000 

Constant 

24.926 

7449.317 

.000 

i 

.997 

6.7E+10 

Step 3* ags(1) 

-1.919 

.710 

7.306 

i 

.007 

.147 

prepris(l) 

-2.115 

.686 

9.496 

i 

.002 

.121 

contrite(l) 

-2.510 

.617 

16.539 

1 

,000 

.081 

married(l) 

.191 

.560 

.116 

i 

.733 

1.210 

-Ccpstant 

3.465 

.940 

13.600 

i 

.000 

31.989 

'Step 4* ageoTv 

-1.913 

,711 

7.247 

i 

.007 

.148 

prepris(1)\ 

-2.089 

.685 

9.299 

i 

.002 

.124 

contrite(l) 

V -2.517 

.616 

16.687 

1 

.000 

.081 

Constant 

\ 3.535 

.926 

14.566 

1 

.000 

34.285 

Step 5 b age(1) 

-2.731 

.786 

12.077 

i 

.001 

.065 

preprls(l) 

/ -1.571 

.695 

5.107 

i 

.024 

.208 

contrlte(i) 

j -22.765 

7466.473 

,000 

i 

.998 

.000 

sexoff(1)w 

-20.951 

7466.473 

,000 

i 

.998 

.000 

s . ^Constan*/ 

"V. 24.648 

7466.473 

s 

o 

1 

.997 

5.1E+10 


8. Variabilă^yTntfodusăîe) în pasuPfNgge'. „prepris", „treatmen", „contrite", „married", „sexofT. 

b. Variabilă^ |ntrodu8ă(«) în pasul 5: „sefcstT 

c. Procedura stepwişa a fost întreruptă deoarecfe-Ojidepărtarea variabilei celei mal puţin semnificative 

determină producerea unui modei stabilit anterît*^ 


Deşi „sexoff a fost eliminată din 
model începând cu pasul 3 şi nu 
apare în pasul 4, i se permite să 
reintre în model odată cu pasul 5 
din simplul motiv că eliminarea 
variabilei „married" după pasul 3 a 
determinat creşterea puterii 
predictive independente a 
variabilei „sexoff astfel încât să 
îndeplinească criteriile necesare 
pentru acceptarea din nou ca fiind 
un bun predictor. 


Este important de observat că ponderile de 
regresie se aplică doar valorilor variabilei de 
categorie care este codificată cu 1. Aşadar, 
ponderea negativă de regresie pentru „sexoff(1)“ 
de -20,951 indică, de fapt, că infractorii sexuali 
au o probabilitate mai mică de recidivă la 
eliberare. Trebuie să aveţi mare grijă să ştiţi ce 
codificări sunt asociate diferitelor valori ale 
variabileior. Această problemă este agravată 
de faptul că variabilele nominale care nu sunt 
codificate cu 0 şi 1 pot fi recodificsîs de către 
SPSS, dându-ii-se aceste valori. 
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Varlables not In th» Equatlon 



Score 

df 

Slg. 

Step 2* 

Varlables 

treatmen(l) 

2.638 

1 

.104 


Overall Statlstics 


2.638 

1 

.104 

Step 3 b 

Variables 

treatmen(l) 

6.160 

1 

.013 



sexoff(t) 

13.026 

1 

.000 


Overail Statlstics 


14.017 

2 

.001 

Step 4 C 

Variables 

treatmen(l) 

5.736 

1 

.017 



married(l) 

.116 

1 

.733 



sexoff(l) 

12.609 

1 

CoocT) 


Overall Statlstics 


14.123 

3 

noT^ 

Step 5 B 

Variables 

treatmen(l) 

2.809 

1 

.094 y. 



married(l) 

.453 

1 

.501 ' 


Overail Statistics 


2.994 

2 

.224 

—--—-V 


b. Variabilă(e) eliminată(e) în pasul 3: „sexoff. 

c. Variabilă(e) eliminată(e) în pasul 4: „married". 


Acest tabel indică semnificaţia 
variabilelor care nu sunt incluse în 
model. Vedeţi care este semnificaţia 
variabilei „sexoff în pasul 4. în 
consecinţă, această variabilă este 
reinclusă în pasul 5. 


33.3. Raportarea constatărilor 

O modalitate de raportare a constatărilor acestei analize ar fi următoarea: „Folosind 
modelul Wald al eliminării regresive, am analizat caracteristicile ce diferenţiază pri¬ 
zonierii care recidivează după eliberare de cei care nu comit o nouă infracţiune. Modelul 
final de regresie indică faptul că infractorii mai tineri, cei care au mai fost în detenţie, 
cei care nu au remuşcări în legătură cu infracţiunile lor şi cei care nu sunt infractori 
sexuali manifestă o probabilitate mai mare de recidivă. Vârsta şi detenţia anterioară au 
constituit predictori semnificativi în proporţie de 5%. Coeficientul Cox şi Sneîl pseudo R 2 
a fost de 0,50, indicând doar o corespondenţă moderată între model şi datele reale. Acest 
model a fost aproape la fel de exact în ceea ce priveşte recidiva (corect In proporţie 
de 88,9%) ca în cazul nonrecidivei (90,0%)”. 













Intervalele de încredere 


a Intervalele de încredere nu constituie nici pe departe un concept nou în statistică, dar 
au fost de curând susţinute ca fiind preferabile estimărilor punctuale folosite în mod 
obişnuit în majoritatea analizelor statistice. Media unui eşantion poate fi folosită 
pentru estimarea mediei populaţiei căreia îi aparţine eşantionul. Această valoare 
estimată a mediei populaţiei este una punctuală din moment ce este exprimată ca 
unică valoare, cum este 5,3. Totuşi, ştim că această valoare estimată care se bazează 
pe un eşantion nu este decât cea mai bună posibilă şi că este probabil ca media reală 
a populaţiei să fie diferită de valoarea estimată. 

* în cazul intervalelor de încredere, media estimată se exprimă în intervale de medii în 
care este probabil să se încadreze media populaţiei. Aşadar, intervalul de încredere al 
unei medii poate fi între 4,2 şi 6,4. 

8S Intervalul de încredere variază în funcţie de nivelul de certitudine cerut de cercetător. 
Aşadar, pentru aceleaşi date, intervalul de încredere care are o probabilitate de 95% 
să includă media populaţiei este mai mic decât intervalul de încredere cu o probabilitate 
de 99% de a conţine media populaţiei. 

B Mai devreme, în această carte, am folosit intervalele de încredere atunci când păreau 
a fi utile în mod deosebit. Una dintre dificultăţile abordării cu intervale de încredere este 
constituită de faptul că, teoretic, orice statistică are un interval de încredere. în ciuda 
acestui lucru, este greu să găsim metodele de calculare a intervalelor în literatura de 
specialitate sau în manualele de statistică. Acest lucru limitează aplicabilitatea abordării 
cu intervale de încredere. Mai concret, aplicaţia SPSS, asemenea altor programe pe 
computer, nu oferă decât un număr limitat de intervale de încredere. 

Intervalele de încredere au fost prezentate în output în cazul următoarelor teste care 
au fost descrise în această carte: 

- Testul de regresie B: vedeţi tabelul de la pagina 86; 

- Testul t pentru eşantioane perechi: vedeţi tabelul de la pagina 105; 

- Testul î pentru eşantioane independente: vedeţi tabelul de la pagina 110; 

- ANOVA One-way pentru eşantioane independente: vedeţi tabelul de Ia pagina 53 ; 

- ANOVA Two-way pentru eşantioane independente: vedeţi tabelele de la paginile 
163 şi 164; 

- Testele prin comparaţii multiple: vedeţi tabelul de la pagina 170; 

- ANCOVA One-way: vedeţi tabelul de la pagina 175. 

Intervalele de încredere se pot obţine cu uşurinţă şi în cazul următoarelor statistici: 

- Testul t pentru compararea unui eşantion cu media populaţiei One-Sample t test; 

- ANOVA One-way pentru eşantioane perechi; 

- ANOVA 2-way mixt; 

- Regresia - pentru predicţia scorurilor. 


ANEXA B 

Alte metode statistice folosite în SP8 


Alte metode statistice oferite în SPSS şi care nu au fost descrise în această carte sunt 
enumerate mai jos, în funcţie de opţiunile din meniul şi submeniul „Analyze” şi de 
opţiunile din casetele de dialog. 
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Index 


A 

abaterea standard 59-63 
abaterea standard 60-61 
alte caracteristici 63 
interpretarea output-ului 61 
introducerea datelor 60 
raportarea output-ului 62 
rezumat 59 
scoruri standard 59 
scoruri z 59, 62 
accesarea SPSS-ului 19-20 
acordul interevatuare 213-219 
alegerea testelor 32-34 

American Standard Code for Information 
Interchange (ASCII) 183 
analiza de covarianţă (ANCOVA) şi analiza mixtă 
de varianţă (ANOVA) 2-way 172-182 
ANCOVA one-way 173-174 
interpretarea output-ului 175-176 
modelul ANOVA 2-way mixt 177-179 
raportarea output-ului 176 
rezumat 172 

analiza de varianţă (ANOVA): scoruri relationate/ 
măsurători repetate 155-159 
interpretarea output-ului 158-159 
metoda one-way ANOVA pentru scoruri rela- 
ţionate 156-157 
raportarea output-ului 159 
rezumat 155 

analiza de varianţă (ANOVA) 
interpretarea output-ului 153-154 
metoda ANOVA one-way pentru eşantioane 
independente 152-153 

metoda one-way ANOVA pentru scoruri nereSa- 
ţionate 151-154 
raportarea output-uiui 154 
rezumat 151 

analiza factorială 191-197 
analiza componentelor principale cu rotaţie 
ortogonală 192-194 
analiza factorială confirmatoare 191 
analiza factorială exploratorie 191 
interpretarea outpuî-aluî 194-196 
raportarea ouîput-ufci; 196-197 


rezumat 191-192 

analiza factorială confirmatoare 191 
analiza îogliniară 220-239 
interpretarea output-ului 222-227 
raportarea rezultatelor 227 
rezumat 220 

analiza nerelaţionată/necorelată a variantei 
151-154 

analiza de varianţă bifactorială pentru scoruri 
relaţionate/nerelaţionate 160-166 
analiza two-way ANOVA cu scoruri nerela- 
ţionate 161-163 
interpretarea output-ului 163 
raportarea output-ului 166 
rezumat 160-161 

ANCOVA vezi analiza de covarianţă 
ANOVA pentru scoruri relaţionate/măsurători 
repetate 154-159 

ANOVA prin comparaţii multiple 167-171 
interpretarea output-ului 169-171 
raportarea output-ului 171 
rezumat 167 

teste prin comparaţii multiple 168-169 
ANOVA vezi analiza de varianţă; ANOVA prin 
comparaţii multiple 
asimetrie 54 

C 

calcul 28-29 

calculul variabilelor noi 137-138 
procesarea unei variabile noi 138-139 
rezumat 137-138 

salvarea procedurii de procesare ca fişier de 
sintaxă 139 
cazuri 30, 95-98 
centile 52 

chi-square 112-125, 220, 228 
chi-square fără tabele deja formate 124 
efectuarea unui Test chi-square 115-116 
goodness-of-fit 112 

interpretarea output-ului pentru Testul chi-square 
117-118 

interpretarea output-ului pentru Testul Fisher 
exact 119 
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INDEX 


interpretarea output-ului pentru Testul 
McNemar 124 

interpretarea output-ului pentru un Test 
chi-square pentru un singur eşantion 121-122 
introducerea datelor caz după caz 114 
introducerea datelor folosind procedura 
„Weighting cases" 113-114 
partiţionarea Testului chi-square 112 
raportarea output-ului pentru Testul chi-square 
118 

raportarea output-ului unui Test chi-square 
pentru un singur eşantion 122 
raportarea output-ului pentru Testul Fisher 
exact 120 

raportarea output-ului pentru Testul McNemar 
124 

rezumat 112-113 

Testul chi-square pentru un singur eşantion 
120-121 

Testul Fisher exact 112, 118-119 
Testul McNemar 112, 122-123 
citirea fişierelor ASCII sau a fişierelor de text 
cu ajutorul Data Editor 183-187 
citirea fişierelor ASCII sau a fişierelor text 
cu date 184-187 
introducere 183-184 
rezumat 183 
clasifică 253 

coeficienţi de corelaţie 75-82 
coeficientul Spearman 79 
corelaţia Pearson 77 
diagrama scatter 80-81 
interpretarea output-ului 78-79, 81 
introducerea datelor 76-77 
raportarea output-ului 78-79, 82 
rezumat 75-76 
coeficientul alpha 212 
coeficientul alpha de validitate a itemilor 
coeficientul de corelaţie Pearson 75-82 
coeficientul de corelaţie Spearman 75-82 
coeficientul kappa 212, 216-218 
compararea a două eşantioane de scoruri core- 
late/relaţionate 102-106 
concepte statistice în analiza cu SPSS 29-31 
corelaţia parţială 188-190 
interpretarea output-ului 190 
raportarea rezultatelor 190 
rezumat 188 
corelaţie 253 

distribuţia de frecvenţă în formă de clopot 140 
cvartile 52 


D 

Data Editor 183-187 
Data Reduction 253 
Data View 27-28 
date nominale 112 
datele de frecvenţă 112 
deschiderea fişierului de date 23-24 
descrierea numerică a rezultatelor 49-53 
abaterea standard (estimată) 52 
analiza 50-51 
centile 52 
cvartile 52 

eroarea standard (SE medie) a mediei 53 

interpretarea output-ului 51 

introducerea datelor 50 

Kurtosis 49, 52 

maxim (scor) 53 

media 49 

mediana 49 

minim (scor) 53 

mod 49 

rang 53 

raportarea output-ului 52 
rezumat 49 
Skewness 52 
sumă 52 

varianţă (estimată) 53 
descrierea variabilelor 35-48 
adăugarea/îndepărtarea etichetelor digaramei 
circulare 42-44 

diagrama cu bare a datelor categoriale 45-46 
diagramă circulară cu date categoriale 41-42 
etichetarea valorilor 39-40 
frecvenţe procentuale 38 
histograme 47-48 
interpretarea output-ului 38 
realizarea tabelelor de frecvenţă prin pon¬ 
derare 36-37 
raportarea rezultatelor 40 
rezumat 35-36 

schimbarea culorii diagramei circulare 44-45 
diagrame circulare 35 
adâugarea/îndepărtarea etichetelor 42-44 
date de categorie 41-42 
schimbarea culorii 44-45 
diagrame cu bare 35 
date categoriale 45-46 
diagrame şi tabele 64-74 
diagramele scatter 62, 75, 80-81 
diferenţe între eşantioane de date de frecvenţă 
112-125 

distribuţie în formă de clopot 54 


INDEX 
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E 

eroarea standard (media SE) 53, 63 
eroarea standard 99-101 
eroarea standard estimată 99 
eroarea standard estimată a mediei 100-101 
interpretarea output-ului 101 
introducerea datelor 100 
raportarea output-ului 101 
rezumat 99 
Testul t 99 

eroarea standard estimată 99 
eşantioane şi populaţii 90-94 
alegerea unui eşantion aleatoriu 92-93 
analiza statistică pe un eşantion aleatoriu 93-94 
eşantionarea aleatorie 91 
interpretarea rezultatelor 93 
rezumat 91 
eşantioane 32-33 

etichetarea tabelelor şi a diagramelor 64 
etichetarea valorilor 39-40 

F 

fidelitate, vezi validitatea itemilor şi acordul 
interevaluare 
fidelitatea test-retest 212 
fişierele text şi Data Editor 183-187 
foile de lucru Excel 183 
forme ale distribuţilor scorurilor 54-58 
asimetria 54 

distribuţia în formă de clopot 54 
histograme 57 

interpretarea output-ului 56, 58 
introducerea datelor 55 
raportarea histogramelor 58 
raportarea output-ului 56 
rezumat 54 
tabele de frecvenţă 55 
unităţile atipice 54 
frecvenţele procentuale 38 

G 

generarea aleatorie a eşantioanelor 91-94 
goodness-of-fit (gradul de corespondenţă) 112, 
220, 229 

H 

histograme 35, 47-48, 54, 57 
histograme compuse 73-74 
histograme compuse (diagrame cu bare grupate) 
64 


1 ii-M 

interpretarea output-ului 38 
intervale de încredere 252 
introducerea datelor 21-22 
introducerea datelor şi analiza statistică în SPSS 
19-34 

accesarea aplicaţiei SPSS 20 
alegerea testelor 32-34 
calcule 28-29 

concepte statistice în analiza cu SPSS 29-31 
Data View 27-28 

deplasarea în cadrul unei ferestre folosind 
mouse-ul 22 

deplasarea în cadrul unei ferestre folosind 

tastatura şi mouse-ul 22 

deschiderea unui fişier de date 23-24 

introducerea datelor 21-22 

ouput-ul SPSS-uIui 29 

rezumat 19 

salvarea datelor 23 

SPSS 12 şi 13 19-20 

tipuri de analiză 33-34 

Variable View 24-26 

K 

Kurtosis (boltirea) 49, 52, 63 

L 

logit 228 
logliniar 253 

M 

măsurători independente 31 
măsuri nerelaţionate 31 
maxim (scor) 53, 63 
media 49, 63 
mediana 49 

medie, variaţie şi dispersie 49-53 
minim (scor) 53, 63 
model de cercetare 31-32, 172 
măsurători nerelaţionate 31 
măsurători relaţionale 31 
modelul anterior testului 172 
modelul ulterior testului 172 
mod 49 
mouse 22 

N 

normalitate 140 



o 

output-ul SPSS-ului 29 
P 

pachetul statistic pentru ştiinţe sociale (SPSS) 
13-15 

partiţionarea Testului chi-square 112 
ponderi b 228 
predicţia cu precizie 83-90 
procedura „Weighting cases” 113-114 

R 

rang 53, 63 

raportarea rezultatelor 40 
raportul şanselor 228 

realizarea tabelelor de frecvenţă prin ponderare 
36-37 

recodificarea valorilor 132-136 
recodificarea valorilor 133-135 
recodificarea valorilor lipsă 135 
rezumat 132-133 

salvarea procedurii de recodificare ca fişier 
de sintaxă 136 
regres ia 83-90, 253 
interpretarea output-ului 86-87, 89-90 
introducerea datelor 84-85 
ponderi 228 

raportarea output-ului 90 
regresia simplă 85-86 
rezumat 83-84 

scatterplot-ul de regresie 87-89 
variabila dependentă 83 
variabila independentă 83 
variabila prezisă 83 
variabila-criteriu 83 
variabila-predictor 83 
variabile X 83 
variabile Y 83 

regresia logistică multinomială 228-239 
interpretarea output-ului 233-238 
introducerea datelor 230-231 
logit 228 
ponderile b 228 
predictorii 228 
raportarea constatărilor 239 
raportul şanselor 228 
regresia logistică 228 
regresia logistică binomială 228 
regresia logistică multinomială stepwise 

231-232 


rezumat 228-230 
variabila dummy 228-229 
regresia logistică, vezi regresia logistică bino¬ 
mială ; regresia logistică multinomială 
regresia multiplă ierarhică 205-211 
analiza prin regresie multiplă ierarhică 206-208 
interpretarea output-ului 208-210 
raportarea output-ului 210-211 
rezumat 205-206 

regresia multiplă stepwise 172-182, 228 
analiza prin regresie multiplă stepwise 199-200 
interpretarea output-ului 200-203 
raportarea output-ului 203-204 
rezumat 198-199 

regresia multiplă, vezi regresia logistică bino¬ 
mială ; regresia multiplă stepwise 
regresia simplă 85-86 
regresie logistică binomială 229, 240-251 
interpretarea output-ului 246-251 
raportarea constatărilor 251 
rezumat 240-244 

relaţiile dintre două sau mai multe variabile 
64-74 

afişarea frecvenţelor ca procentaj din numărul 
total 69-70 

afişarea frecvenţelor ca procentaj din totalul 
coloanei 70 

diagrama procentuală compusă cu bare (supra¬ 
puse) 71-72 

etichetarea tabelelor şi diagramelor 64 
histogramă compusă (diagramă cu bare gru¬ 
pate) 73-74 

histograme compuse (diagrame cu bare gru¬ 
pate) 64 

introducerea datelor 65-66 

ponderarea datelor 66-67 

rezumat 64-65 

diagrame scatter 64 

statistici bivariate 64 

statistici univariate 64 

tabele de asociere 64 

tabelele de asociere cu frecvenţe 67-69 


salvarea datelor 23 
Scale 253 
scoruri z 59, 62 
scoruri atipice 54 
scoruri standard 59 
selectarea cazurilor 95-98 
mtroducerea datelor 96 
rezuraaî 95-96 


selectarea cazurilor 96-98 
subgrupe 96 

semnificaţia statistică 102 
seturi 31 
Skewness 52, 63 
SPSS 10 
diferenţe 17 
SPSS 11 
diferenţe 17 
SPSS 12 şi 13 
diferenţe la SPSS 12 17 
statistica descriptivă 30, 253 
statistică inferenţială 30-31 
eşantioane 30-31 

statistică univariată (cu o singură variabilă) 64 
statistică, vezi statistică descriptivă ; statistică 
inferenţială 
statistici bivariate 64 
statistici nonparametrice 140-146 
subgrupe 95 
sumă 52, 63 
supravieţuire 254 


tabele de asociere 64 
tabele şi diagrame 35-48 
diagrame circulare 35 
diagrame cu bare 35 
histograme 35 
tabele de frecvenţă 35 
tabelele de frecvenţă 35, 55 
teste de rang 140-146 

distribuţiile de frevenţă în formă de clopot 140 

( interpretarea output-ului pentru Testul sem¬ 
nului 142 

interpretarea output-ului pentru testul Wilcoxon' 
143 

interpretarea output-ului tentru Testul U Mann- 
-Whitney 145-146 

raportarea output-ului pentru Testul semnului 
142 

raportarea output-ului pentru Testul U Mann- 
i -Whitney 146 

raportarea output-ului pentru Testul Wilcoxon 
143 

scoruri nerelaţionate : Testul U Mann-Whitney 
140, 143-145 

scoruri relaţionale : Testul semnului 141-142 
| scoruri relaţionale: Tesul Wilcoxon 140,143 

statistici nonparametrice 140-146 
rezumat 140-141 
| teste nonparametrice 253 


testele statistice din SPSS 253-254 
Testul Fisher exact 112, 118-120 
Testul F 148-150 
Testul McNemar 112, 122-123 
testul raportului de varianţă 147-150 
calcularea raportului de varianţă din output 150 
raportarea valorii raportului de varianţă 150 
rezumat 147-148 
Testul F 147-150 
varianţa estimată 148-149 
Testul semnului 140-142 
Testul t: scoruri corelate/relaţionate 99,102-106 
interpretarea output-ului 105-106 
introducerea datelor 103-104 
rezumat 102-103 
semnificaţia statistică 102 
Testul t pentru eşantioane perechi 104 
raportarea output-ului 106 
vezi şi ANOVA prin comparaţii multiple 
Testul t: scoruri nerelaţionate/necoreîate 107-111 
intepretarea output-ului 110-111 
introducerea datelor 108-109 
raportarea rezultatelor 111 
rezumat 107-108 

Testul t pentru eşantioane independente 109-110 
vezi şi ANOVA prin comparaţii multiple 
Testul U Mann-Whitney 140, 143-146 
Testul Wilcoxon 140, 143 
Time Series 254 

tipuri de analiză şi proceduri SPSS 33-34 
tipuri de variabile nominale/categoriale 30 
variabile numerice 30 

V 

valabilitatea prin metoda split-half 212, 215 
validitatea itemilor şi acordul interevaluare 
212-219 

acordul dintre evaluatori (coeficientul kappa) 
216-218 

coeficientul alpha 212 

coeficientul alpha de validitate a itemilor 34, 
212-215 

fidelitatea test-retest 212 
interpretarea output-ului 214-215, 219 
raportarea output-ului 215-216, 219 
rezumat 212 
valorile lipsă 126-131 
definirea valorilor lipsă 128 
eşantion din output pentru ştergerea listwise 
130-131 

eşantion din output pentru ştergerea pairwise 
130 

interpretarea output-ului 131 
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opţiunile pairwise şi listwise 128-129 
raportarea output-uiui 131 
rezumat 126-127 
variabile covariate 172-182 
variabilă dependentă 84, 160 
variabila dummy 228 
variabila prezisă 83 
variabila X 83 
variabila Y 83 
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au apărut: 

Adrian Neculau (coord.) - Psihologie socială. Aspecte contemporane 
Andrei Cosmovici - Psihologie generală 

) W. Doise, J.-C. Deschamps, G. Mugny - Psihologie socială experimentală 
Adrian Neculau, Gilles Ferrdol (coord.) - Minoritari, marginali, excluşi 
| Constantin Cucoş - Minciună, contrafacere, simulare, O abordare psihopedagogică 
\ Mielu Zlate (coord.) - Psihologia vieţii cotidiene 

| R.Y. Bourhis, J.-P. Leyens (coord.) - Stereotipuri, discriminare şi relaţii intergrupuri 
l Serge Moscovici - Psihologia socială sau maşina de fabricat zei 
Adrian Neculau (coord.) - Câmpul universitar şi actorii săi 
I Adrian Neculau (coord.) - Psihologia câmpului social. Reprezentările sociale 
\ ^ Barus-Michel, F. Giust-Desprairies, Luc Ridel - Crize. Abordare psihosocială clinică 

] Andrei Cosmovici, Luminiţa lacob (coord.) - Psihologie şcolară 
\ Şerban Ionescu - Paisprezece abordări în psihopatologie 

Serge Moscovici (coord.) - Psihologia socială a relaţiilor cu celălalt 

Willem Doise, Gabricl Mugny - Psihologie socială şi dezvoltare cognitivă 

Ana Stoica-Constantin, Adrian Neculau (coord.) - Psihosociologic rezolvării conflictului 

Andr6 Sirota - Conduite perverse în grup 

Adrian Neculau, G. Ferr6ol (coord.) - Psihosociologia schimbării 

Mircea Miclea - Psihologie cognitivă. Modele teoretico-experimentale 

Mielu Zlate - Psihologia mecanismelor cognitive 

Gilles Fcrrdot (coord.) - Identitatea, cetăţenia şi legăturile sociale 

Mielu Zlate - Introducere în psihologie 

Ion Dafinoiu - Elemente de psihoterapie integrativă 

Eva Drozda-Senkowska - Psihologia socială experimentală 

Cornel Havârneanu - Cunoaşterea psihologică a persoanei. 

Posibilităţi de utilizare a computerului în psihologia aplicată 
Steve Duck - Psihologia relaţiilor inierutnane. Teorie, concepte şi noţiuni fundamentale 
Valentin Clocotici, Aurel Stan - Statistică aplicată în psihologie 
Gilles Ferreol (coord.) - Adolescenţii şi toxicomania 
Adrian Neculau (coord.) - Analiza şi intervenţia în grupuri şi organizaţii 
Pierre De Visscher, Adrian Neculau (coord.) - Dinamica grupurilor. Texte de bază 
Mihaela Roco - Creativitate şi inteligenţă emoţională 
Jean Delacour - Introducere în neuroştiinţele cognitive 

Ion Dafinoiu - Personalitatea. Metode de abordare clinică: observaţia şi interviul 
Septimiu Chelcea - Un secol de cercetări în psihosociologie 
Aurel Stan - Testul psihologic. Evoluţie, construcţie, aplicaţii 

Dan Goglează - Psihoterapia ca relaţie a schimbării individuale. Strategii, cazuri, soluţii, comentarii 

Alex Mucchielli - Arta de a influenţa. Analiza tehnicilor de manipulare 

Michel-Louis Rouquette - Despre cunoaşterea maselor. Eseu de psihologie politică 

Vincent Yzerbyt, Georges Schadron - Cunoaşterea şi judecarea celuilalt 

Mihai Kramar - Psihologia stilurilor de gândire şi acţiune umană 

Jean-Claudc Abric - Psihologia comunicării. Teorii şi metode 

Şerban Ionescu, Maric-Madeleine Jacquet, Claudc Lhote - Mecanismele de apărare. 

Teorie şi aspecte clinice 













Ştefan Boncu - Psihologia influenţei sociale 

Daniel Gaonac’h, Pascale Larigauderie - Memorie şi funcţionare cognitivă 

Bruna Zani, Augusto Palmonari - Manual de psihologia oomunităţii 

Ion Dafmoiu, Jeno Lâszlâ Vargha - Hipnoza clinică. Tehnici de inducţie. Strategii terapeutice 

Adrian Neculau (coord.) - Manual de psihologie socială 

Mihaela Vlăsceanu - Organizaţii şi comportament organizaţional 

lolanda Mitrofon (coord.) - Cursa cu obstacole a dezvoltării umane. 

Psihologie, psihodiagnoză, psihoterapie centrată pe copil şi familie 
Constantin Enăchescu - Tratat de psihanaliză şi psihoterapie 
Jacques Montangero - Vis şi cogniţie 
Constantin Enăchescu - Tratat de psihosexologie 
Roy Schafer - Interpretarea psihanalitică a testului Rorschach 
Patrick Rateau - Metodele şi statisticile experimentale în ştiinţele umane 
Ivana Markovâ - Dialogistica şi reprezentările sociale 
Zoltân Bogâthy (coord.) - Manual de psihologia muncii şi organizaţională 
Dorina Sălăvăstru - Psihologia educaţiei 
Mielu Zlate - Leadership şi management 
Constantin Enăchescu - Tratat de igienă mintală 
Mielu Zlate - Tratat de psihologie organizaţional-managerială 
Ticu Constantin - Evaluarea psihologică a personalului 

Ana Stoica-Constantin - Conflictul interpersonal. Prevenire, rezolvare şi diminuarea efectelor 

Aiex Mucchielli - Arta de a comunica. Metode, forme şi psihologia situaţiilor de comunicare 

Nicolae Mitrofan, Laurenţiu Mitrofon - Testarea psihologică. Inteligenţa şi aptitudinile 

Ion Dafmoiu, Jen<5-Lâszl6 Vargha - Psihoterapii scurte. Strategii, metode, tehnici 

Constantin Enăchescu - Tratat de teoria cercetării ştiinţifice 

Vasile Cernat - Psihologia stereotipurilor 

Marîus Milcu - Psihologia relaţiilor interpersonale 

Constantin Enăchescu - Tratat de psihopatologie 

Romeo Zeno Creţu - Evaluarea personalităţii 

Geraid Matthews, Ian J. Deary, Martha C. Whiteman - Psihologia personalităţii. Trăsături, 
cauze, consecinţe 

Daniel David - Psihologie clinică şi psihoterapie. Fundamente 

Mihai Curelaru - Reprezentări sociale 

Daniel David - Metodologia cercetării clinice. Fundamente 

Dennis Howitt, Duncan Cramer - Introducere în SPSS pentru psihologie 

în pregătire: 

Ana Muntean - Psihologia dezvoltării umane 

Zoltân Bogâthy (coord.) - Manual de tehnici şi metode în psihologia muncii 
şi organizaţională 

Mielu Zlate - Tratat de psihologie organizaţional-mamgeriaiă, voi. al îî-lea 
Ticu Constantin - Psihologia reclamei 
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